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一 直 以 来 人 类 的 知识 可 以 分 为 两 类 : “明知 识 ” 和 “ 默 知识 ? 
(Tacit Knowldge， 又 称 默 会 知识 ) 。 明 知识 就 是 那些 可 以 用 文字 或 
公式 清晰 描述 和 表达 出 来 的 知识 。 默 知识 则 是 个 人 在 感觉 上 能 把 握 但 
无 法 清晰 描述 和 表达 的 知识 ， 也 即 我 们 常 说 的 “只 可 意 会 ， 不 可 言 
传 ” 的 那 类 知识 。 人 类 发 明文 字 以 来 ， 积 累 的 知识 主要 是 明知 识 ， 因 
为 只 有 明知 识 才 可 以 记录 和 传播 。 直 到 大 约 70 年 前 ， 人 类 才 意 识 到 默 
知识 的 存在 。 今 天 ， 人 工 智 能 ， 特 别 是 其 中 的 一 个 重要 流派 一 一 神经 
网 络 ， 突 然 发 现 了 海量 的 、 人 类 既 无 法 感受 又 无 法 描述 和 表达 的 “了 暗 
知识 ”一 一 隐藏 在 海量 数据 中 的 相关 性 ， 或 者 万 事 万 物 间 的 隐蔽 关 
系 。 这 些 瞳 知识 可 以 让 我 们 突然 掌握 不 可 思议 的 “魔力 ”， 能 够 做 很 
多 过 去 无 法 想象 的 事情 。 本 书 就 是 要 清楚 阐述 机 器 学 习 发 据 出 了 什么 
样 的 瞳 知识 ， 为 什么 机 器 能 够 发 现 这 些 瞳 知 识 ， 以 及 这 些 瞳 知 识 对 我 
们 每 个 人 会 有 什么 影响 。 

本 书 分 为 三 个 部 分 。 

第 一 部 分 包括 第 一 、 二 、 三 章 ， 其 中 第 一 章 里 我 们 发 现 
AlphaGo (阿尔 法 围棋 ) 给 我 们 带 来 的 最 大 震撼 是 人 类 完全 无 法 理解 机 
器 关于 下 棋 的 知识 。 这 个 发 现 迫 使 我 们 重新 审视 人 类 对 于 “知识 ”的 
所 有 观念 。 这 一 章 回 顾 了 2 500 年 来 人 类 所 熟悉 的 明知 识 和 直至 大 约 70 
年 前 才 注 意 到 的 默 知识 。 近 几 十 年 的 脑 神经 科学 的 研究 成 果 让 我 们 对 
知识 的 本 质 有 了 更 清楚 的 认识 ， 也 回答 了 为 什么 人 类 既 无 法 感受 ， 也 
无 法 理解 机 器 发 现 的 那些 暗 知 识 。 这 一 章 还 分 析 了 明知 识 、 默 知识 和 
瞳 知 识 之 间 的 区 别 ， 讨 论 了 为 什么 暗 知识 的 总 量 将 远 远 超过 人 类 能 掌 
握 的 所 有 知识 。 


市 站 绍 了 机 器 是 怎样 学 习 的 ， 能 学 习 哪 些 知识 ， 同 时 介绍 了 
机 器 学 习 大 ， 派 以 及 名; 流派 从 数据 中 挖掘 知识 的 方法 。 


第 三 章 则 重点 介绍 了 目前 机 器 学 习 中 最 火 的 神经 网 络 ， 包 括 神经 
网 络 的 基本 工作 原理 和 目前 在 商业 上 应 用 最 广 的 几 种 形态 ， 以 及 各 自 
适用 的 领域 。 有 了 这 些 基础 就 可 以 判断 A| (人 工 智 能 ) 在 各 个 行业 的 
el nd. 才能 真正 理解 暗 知识 的 特 

。 为 易于 阅读 和 照顾 不 同 读者 的 需求 ， 在 这 一 章 中 我 们 尽量 用 通俗 
a 而 把 精确 的 技术 原理 介绍 放 在 附录 里 。 


第 二 部 分 (第 四 、 五 章 ) 讨论 了 AI 对 商业 的 影响 。 我 们 将 看 到 机 

器 发 据 出 来 的 上 暗 知识 对 我 们 生活 的 直接 影响 人 
的 读者 来 说 ， 这 部 分 的 内 容 至 关 重 要 。 其 中 ， 第 四 章 描 述 了 当前 的 AI 
产业 生态 ， 第 五 章 详尽 探讨 了 哪些 行业 将 面临 A1l 的 颠覆， 以 及 在 不 同 
行业 的 投资 机 会 和 陷阱 。 


第 三 部 分 〈 第 六 、 七 章 ) 的 内 容 是 A1 对 未 来 和 社会 的 影响 。 第 六 
章 重 点 讨论 目前 还 没有 商业 化 的 ， 但 可 能 更 深刻 影响 我 们 的 一 些 神 奇 
的 Al 应 用 。 BA 机 器 能 在 多 大 程度 上 取代 
人 的 工作 ， 会 造成 哪些 社会 问题 (例如 大 面积 失业 ) 。 这 两 章 的 主要 
RE 探讨 那些 我 们 今天 可 能 还 看 不 到 的 更 深远 的 影响 。 本 
章 也 试图 回答 人 类 的 终极 恐惧 : 机 器 人 最 终 会 控制 人 类 吗 ? 


本 书 的 各 个 章节 前 后 连贯 ， 但 也 可 以 跳 着 读 ， 对 于 那些 只 对 商业 
感 兴趣 的 读者 ， 可 以 跳 过 第 二 、 三 章 直 接 读 第 四 、 五 章 。 


笔者 在 美国 斯 坦 福 大 学 读 博士 期 间 做 过 人 工 智能 研究 ， 后 来 在 硅 
谷 和 中 国 创 办 高 科技 公司 ， 目 前 在 硅谷 专注 于 投资 人 工 智 能 。 每 年 访 
问 调 研 上 千家 硅谷 和 中 国 的 科技 公司 ， 接 触 顶 级 大 学 最 前 沿 的 研究 ， 
这 些 都 有 助 于 笔者 从 大 量 的 实践 中 提炼 出 自己 对 行业 的 原创 的 分 析 和 
洞 见 ， 而 不 是 人 云 亦 云 。 


章 介绍 了 机 
的 五 大 流 


笔者 长 期 对 人 类 如 何 获得 知识 感 兴趣 ， 在 投资 、 研 究 和 写作 Al 的 
过 程 中 ， 发 现 了 瞳 知识 这 样 一 个 人 类 以 往 未 曾 发 现 的 领域 。 这 个 概念 
的 提出 一 定 会 引起 争议 ， 笔 者 欢迎 读者 的 批评 并 期 待 在 批评 和 讨论 中 
进一步 深化 在 这 方面 的 认识 。 


本 书 的 目标 读者 是 企业 和 政府 工作 人 员 及 其 他 知识 阶层 ， 包 括 学 
生 。 有 瞳 知识 对 人 类 的 影响 刚刚 开始 。 从 有 瞳 知识 这 个 新 视角 出 发 ， 可 以 
更 深刻 地 理解 这 次 AI 巨 浪 。 这 波 巨 浪 可 能 超过 互联 网 ， 许 多 行业 都 会 
深 受 影响 。 本 书 布 望 能 回答 “AI 对 我 的 行业 和 职业 会 有 什么 影响 ”。 
只 有 把 A1 的 技术 、 趋 势 和 应 用 深入 浅 出 地 讲 清楚 ， 读 者 才 可 能 举 一 反 
三 ， 理 解 A1 对 自己 的 影响 。 本 书 从 笔者 自己 的 投资 实践 出 发 ， 希 望 能 
为 在 A1 时 代 进 行 投资 提供 一 些 参考 。 在 AI 飓风 里 泥 沙 俱 下 ， 鱼 龙 混 
杂 ， 会 有 大 量 的 炒作 ， 读 完 本 书 可 以 帮助 读者 办 别 真 伪 ， 不 会 被 轻易 
忽悠 。 在 今后 5 10 年， 不论 是 风险 投资 / 私 慕 股权 投资 还 是 在 公开 股票 
市 场 投资 都 需要 有 这 样 的 辨别 能 力 。 本 书 最 后 在 讨论 人 工 物 能 对 整个 
社会 的 影响 时 也 提出 了 一 些 未 经 检验 的 建议 。 


每 当 读 到 市 面 上 科技 类 的 书籍 时 ， 常 被 那些 含混 不 清 的 描述 所 困 
扰 。 当 年 在 斯 坦 福 大 学 上 课时 留 下 的 最 深 印 象 就 是 那些 学 科 的 开山 曙 
祖 对 自己 学 科 理解 之 深入 。 他 们 能 用 最 简单 的 方式 把 最 深奥 的 道理 讲 
明白 ， 让 听课 的 学 生 一 下 子 就 能 理解 一 门 学 科 的 核心 概念 ， 而 且 一 莫 
子 不 会 忘记 。 从 那 以 后 ， 笔 者 就 坚信 ， 如 果 学 生 没 听 懂 ， 一 定 是 老师 
没 讲 明白 。 这 本 书 希 望 用 最 通俗 易 懂 的 语言 介绍 瞳 知 识 和 Al1。 任 何 具 
有 高 中 以 上 学 历 的 读者 如 果 有 没 读 懂 的 地 方 ， 一 定 是 因为 笔者 没有 写 
明白 。 

今天 每 个 人 都 要 面 对 海 量 的 信息 和 知识 ， 如 何 让 读者 花 最 少 的 时 
间 获 取 最 大 量 的 信息 和 知识 成 为 一 个 挑战 。 笔 者 最 欣赏 的 文章 和 书 藉 
是 那些 没有 一 名 多 余 的 话 的 ， 这 也 是 笔者 写作 本 书 的 目标 之 一 。 本 书 
希望 能 够 做 到 读者 在 机 场 书店 买 了 这 本 书后 能 在 下 飞机 前 读 完 ， 而 且 
读 完 之 后 可 以 清晰 地 判断 这 场 技术 大 浪 对 自己 的 影响 。 


王 维 嘉 
2019 年 1 月 13 日 于 硅谷 


序言 
“上 蜡 知识 ”和 现代 社会 


自 2017 年 AlphaGo 大 胜 柯 洁 ， 人 工 智 能 即将 碾 轧 人 类 的 话题 便 进 入 
大 众 视野 ， 迅 即 引 起 普遍 的 狂热 和 焦虑 。 我 认为 ， 王 维 嘉 这 本 《有 瞳 知 
识 : 机 器 认 知 如 何 站 覆 商业 和 社会 》 的 出 版 ， 是 对 这 种 情绪 的 有 效 清 
醒 剂 和 解毒 药 。 


说 这 本 书 是 清醒 剂 ， 是 因为 它 极为 简明 清晰 地 叙述 了 人 工 智能 的 
科学 原理 及 其 技术 实现 ， 无 论 是 神经 网 络 结构 ， 其 自我 学 习 的 过 程 ， 
还 是 深度 学 习 和 卷 积 机 制 ，《 瞳 知识 : 机 器 认 知 如 何 颠 履 商 业 和 社 
会 》 比 现在 出 版 的 任何 一 本 书 都 讲 得 更 清楚 、 易 读 。 以 人 类 认 知 为 背 
景 来 解读 人 工 智 能 ， 正 好 可 以 为 当前 人 工 智 能 领域 中 泛 起 的 非 理性 狂 
热 降 温 。 其 实 ， 早 在 20 世 纪 60 年 代 ， 控 制 论 创始 人 维 纳 (Norbert 
Wiener) 的 学 生 阿 比 布 (Michael Arbib) 在 《大 脑 、 机 器 和 数学 》 一 
书 中 ， 已 经 清晰 地 叙述 了 神经 元 网 络 数学 模型 和 学 习 机 原理 ， 并 讲 过 
这 些 原理 有 助 于 我 们 “从 “机 器 ”中 “ 赶 走 鬼魂 ' ”。 阿 比 布 讲 的 
“机 器 ”是 指 大 脑 的 记忆 、 计 算 和 学 习 等 功能 ， 它 们 自 笛 卡 儿 以 来 被 
视 为 机 器 的 有 机 体 〈 生 物 ) ，“ 和 鬼魂 ” 则 是 指 生物 的 本 能 和 学 习 能 
力 。 而 王 维 嘉 的 《了 瞳 知识 : 机 器 认 知 如 何 显 者 商业 和 社会 》 一 书 ， 
“ 赶 走 ”的 不 是 以 往 所 说 的 有 机 体 的 神秘 性 ， 而 是 对 人 工 智能 研究 和 
可 能 性 的 想象 中 的 “鬼魂 ”， 即 误 以 为 当 神 经 元 网 络 的 连接 数量 接近 
于 人 脑 时 ， 它 们 会 涌现 出 如 人 类 那样 的 自我 意识 和 主体 性 等 。 


人 工 智 能 的 神经 元 网 络 系 统 能 做 什么 ? 如 上 所 说 ， 蛙 在 它 被 做 出 
来 以 前 ， 数 学 家 已 经 证 明 ， 无 论 神经 元 网 络 多 么 复杂 ， 它 等 价 于 有 限 


自动 机 ; 而 一 个 能 和 环境 确定 性 互动 〈( 自 耦合 、 反 馈 和 自我 学 习 ) 的 
有 限 自 动机 (神经 元 网 络 ) ， 只 不 过 是 某 一 种 类 型 的 图 灵机 〈 通 用 计 
匠人 


也 就 是 说 ， 人 工 智 能 革命 之 基础 一 一 神经 元 网 络 的 自我 学 习 及 其 
与 环境 互动 所 能 达到 的 极限 ， 都 超 不 过 图 灵机 的 行为 组 合 。 从 20 世 纪 
下 半 叶 至 今 ， 伴 随 着 人 工 智能 的 快速 、 高 度 发 展 ， 关 于 它 能 否 在 未 来 

某 一 天 具有 意识 的 讨论 ， 一 直 是 在 电脑 和 人 脑 差 别 的 框架 二 

我 认为 ， 只 要 发 展 出 相应 的 数学 理论 ， 就 能 了 解 神 经 元 网 络 学 习 已 做 
出 的 和 可 能 做 的 一 切 。 但 有 一 点 是 毫 无 疑问 的 ， 它 不 可 能 具有 自我 意 
识 、 主 体 性 和 自主 性 

为 什么 说 这 本 书 是 解毒 药 ? 因为 维 嘉 在 解释 为 什么 人 工 智能 可 以 
比 人 更 多 、 更 快 地 掌握 知识 〈 能 力 ) 时 ， 把 人 工 智 能 所 掌握 的 信息 定 
义 为 “ 瞳 知 识 ”， 从 而 可 以 得 出 清晰 的 理论 表述 。 我 们 首先 要 弄 明 白 
什么 是 知识 ， 知 识 就 是 人 获得 的 信息 。 而 人 利用 信息 《知识 ) 离 不 开 
获得 信息 和 表达 信息 两 个 基本 环节 ， 人 获得 信息 是 用 感官 感知 〈 即 经 
验 的 ) ， 表 达 信 息 是 通过 符号 〈 语 言 ) 和 对 符号 结构 之 研究 (符号 可 
以 是 非 经 验 的 ) 。 这 样 ， 他 根据 “可 否 感 知 ” 和 “可 否 表 达 ”， 把 人 
可 利用 的 知识 分 为 如 下 四 种 基本 类 型 : 

第 一 ， 可 感知 亦 可 表达 的 知识 。 它 包括 迄今 为 止 所 有 的 科学 和 人 
文 知 识 。 

第 二 ， 不 可 感知 但 可 表达 的 知识 。 任 何 经 验 的 东西 都 是 可 感知 
的 ， 不 可 感知 的 就 是 非 经 验 的 。 有 这 样 的 知识 吗 ? 当然 有 。 以 数学 为 
例 ， 抽 象 代 数 的 定理 是 正确 的 知识 ， 但 可 以 和 经 验 无 关 。 人 之 所 以 为 
， 就 在 于 可 以 拥有 纯 符号 的 知 织 ， 它 是 理性 的 重要 基础 。 

第 三 ， 可 感知 但 不 可 表达 的 知识 。 它 包括 人 的 非 陈述 性 记忆 和 

“上 默 会 知识 ”。 


第 四 ， 不 可 感知 亦 不 可 表达 的 知识 。 这 就 是 当前 神经 元 网 络 通过 
学 习 掌 握 的 知识 。 维 嘉 将 这 类 大 大 超出 了 个 别人 所 能 记忆 和 学 习 的 知 
识 称 为 “ 瞳 知识 ”。“ 瞳 知识 ”的 提出 ， 不 仅 是 一 项 哲学 贡献 ， 也 为 
当前 盛行 的 科学 乌托邦 提供 了 一 剂 解毒 药 。 


20 世 纪 社 会 人 文 研究 最 重要 的 成 就 ， 就 是 发 现 “ 默 会 知识 ”和 市 
场 的 关系 。 人 类 可 共享 的 知识 都 是 可 以 用 符号 表达 的 知识 ， 但 它 不 可 
能 包含 每 个 人 都 具有 的 “上 默 会 知识 ”。 经 济 学 家 利用 “上 默 会 知识 ”的 
存在 ， 证 明了 基于 理性 和 科学 知识 的 计划 经 济 不 可 能 代替 市 场 机 制 。 
一 个 充分 利用 人 类 知识 的 社会 一 定 是 立足 于 个 人 自主 、 互 相交 换 自 
己 的 能 力 和 知识 所 形成 的 契约 组 织 。 忽 视 所 有 个 人 具有 的 “ 默 会 知 
识 ”， 把 基于 理性 和 可 表达 的 知识 设计 出 的 社会 制度 付 诸 实践 ， 会 出 
现 与 原来 意图 相反 的 后 果 。 哈 耶 克 称 这 种 对 可 表达 知识 的 迷信 为 “ 理 
性 的 自负 ”。 今天 随 着 大 数据 的 应 用 ， 这 种 理性 的 自负 再 一 次 出 现在 
人 工 智 能 领域 。 而 “上 暗 知识 ”的 提出 ， 扩 大 了 不 能 用 符号 表达 知识 的 
范围 ， 进 一 步 证 明了 哈 耶 克 的 正确 性 。 所 以 ， 我 说 这 本 书 是 对 当前 理 
性 自负 的 有 效 解毒 药 。 


维 嘉 在 书 中 提出 的 另 一 个 有 意义 的 问题 是 “ 瞳 知 识 ” 会 在 何 种 程 
度 上 改变 现代 社会 。 正 如 该 书 副 标题 所 说 ， 这 种 新 型 知识 大 规模 的 运 
用 ， 将 会 导致 大 量 拥有 专门 知识 和 技能 的 人 失业 、 一 批 又 一 批 的 行业 
消失 ， 甚 至 连 医生 专家 都 可 能 被 取代 。 姑 且 不 论 这 种 预测 是 否 准 确 ， 
有 一 点 是 肯定 的 ， 即 人 工 智 能 必定 会 极 大 地 改变 我 们 赖 以 生存 的 社 
会 。 那 么 ， 它 会 把 人 类 社会 带 到 哪里 去 ? 这 正 是 人 工 智 能 革命 带 来 的 
普遍 焦虑 之 一 。 人 工 智 能 对 城市 管理 和 对 每 个 人 私 隐 的 掌握 ， 是 否 会 
导致 个 人 自由 和 隐私 的 形 失 ? 由 大 数据 和 人 工 智 能 高 科技 管理 的 社 
会 ， 还 是 契约 社会 吗 ? 

现代 社会 和 传统 社会 的 本 质 不 同 就 在 于 其 高 度 强 调 个 人 的 主体 性 
和 创造 性 ， 任 何 信息 的 获得 、 表 达 和 应 用 都 离 不 开 个 人 的 主体 性 和 创 
造 性 。 我 认为 ， 人 工 智 能 可 以 具有 掌握 “有 瞳 知 识 ” 的 能 力 ， 但 它 不 可 


能 具有 自我 意识 ， 当 然 亦 无 所 谓 主体 性 ， 它 只 能 被 人 所 拥有 。 因 此 ， 
一 个 能 允许 知识 和 技术 无 限制 进步 的 社会 ， 仍 然 是 建立 在 个 人 契约 之 
上 的 。 也 就 是 说 ， 无 论 科 学 技术 发 展 到 什么 程度 ， 现 代 社 会 的 性 质 不 
会 因 之 而 改变 。 


然而 ， 我 认为 ， 人 工 智能 或 许 会 使 现代 社会 的 科 层 组 织 的 形式 发 
生 改 变 。 为 什么 现代 社会 需要 科 层 组 织 ? 众所周知 ， 现 代 社 会 除了 由 
法 律 和 回 约 提供 组 织 框架 以 外 ， 还 必须 向 所 有 人 提供 不 同类 型 的 公共 
事务 服务 ， 如 治安 、 交 通 设 施 、 教 育 、 医 疗 等 。 为 此 就 要 设立 处 理 不 
同类 型 事务 的 专门 机 构 来 管理 社会 ， 如 军队 和 政府 科 层 组 织 。 科 层 组 
织 之 间 功 能 的 实现 和 协调 ， 要 利用 符号 表达 的 共享 知识 ， 因 此 ， 随 着 
现代 社会 的 复杂 化 ， 必 定 出 现 技 术 官 傣 的 膨胀 。 而 人 工 智能 革命 和 
“了 瞳 知 识 ” 的 运用 ， 必 定 会 向 社会 管理 层面 深入 。 如 果 它 运用 得 不 
好 ， 会 使 现代 社会 生长 出 超级 而 无 能 的 官僚 机 构 的 毒瘤 ; 如 果 它 运用 
得 好 ， 可 以 促使 人 更 好 地 发 挥 自 主 性 和 创造 性， 甚至 可 以 取代 科 层 管 
理 中 不 必要 的 机 构 。 因 此 ， 我 认为 人 工 智能 将 会 在 这 一 层面 给 现代 社 
会 带 来 巨大 影响 。 


科 层 组 织 的 形成 和 理性 化 的 关系 ， 是 韦伯 分 析 现 代 社 会 的 最 重要 
贡献 。 在 未 来 ， 随 着 人 工 智 能 对 “了 瞳 知 识 ” 的 掌握 和 运用 向 社会 管理 
渗透 ， 甚 而 替代 ， 将 会 证 明 韦 伯 这 一 重要 论断 不 再 成 立 。 可 惜 的 是 ， 
维 嘉 的 《上 暗 知识 : 机 器 认 知 如 何 颠 履 商 业 和 社会 》 一 书 忽 略 了 人 工 智 
能 革命 和 现代 社会 官僚 化 关系 的 讨论 。 科 层 组 织 的 设立 是 基于 理性 
(共享 知识 ) ， 人 工 智 能 擅长 的 是 掌握 “有 瞳 知识 ”， 如 果 从 事 社会 公 
共事 务 管理 的 人 员 可 以 被 掌握 “有 瞳 知 识 ” 的 人 工 智 能 取代 ， 科 层 组 织 
还 有 存在 的 必要 吗 ? 或 者 ， 它 将 以 什么 样 的 新 形式 存在 ? 如 果 不 再 需 
要 科 层 组 织 ， 未 来 无 政府 的 现代 社会 将 如 何 运行 ? 这 正 是 我 们 应 该 关 
注 的 ， 它 需要 人 文 和 科学 两 个 领域 的 对 话 。 


金 观 涛 
2019 年 2 月 


Zh 26, 2017 


译 : 我 非常 高 兴 推 荐 这 本 书 。 这 本 书 对 机 器 学 习 的 发 明 带 来 的 下 一 场 工 业 革 命 进行 
了 详尽 的 分 析 。 我 硕 望 这 个 技术 将 被 用 来 使 人 类 的 生活 更 美好 、 更 和 平 ， 并 不 再 有 
战争 。 一 一 伯 纳 德 。 威 德 罗 ，2019 年 2 月 26 日 于 斯 坦 福 


和 


是 -十 


模 空 出 世 一 一 瞳 知 识 的 用 现 


正当 人 类 自 以 为 掌 握 了 关于 这 个 世界 的 海量 知识 时 ， 一 种 能 
够 自我 学 习 的 机 器 给 了 我 们 当头 一 棒 : 机 器 发 现 了 一 类 人 类 既 无 
法 感受 ， 也 不 能 理解 的 知识 。 这 类 知识 的 发 现 ， 逼 迫 我 们 重新 审 
视 过 去 所 有 关于 知识 的 观念 。 我 们 回顾 了 2 500 年 来 在 这 个 问题 上 
的 争论 : 知识 是 通过 经 验 得 到 的 还 是 通过 推理 得 到 的 ? 直到 大 的 


70 年 前 人 们 才 注 意 到 那些 “只 可 意 会， 不 可 言传 ”的 默 知识 的 重 

要 性 。 但 这 些 争 ? 和 研究 结果 面前 都 显得 肤浅 和 苍 

pe 几 十 年 的 科学 研究 确认 了 认 知 的 基础 是 大 脑 神经 元 之 间 
的 连接 。 有 了 这 个 基础 ， 我 们 就 很 容易 理解 为 什么 有 些 知识 无 法 

表达 ， 也 才能 明白 为 什么 人 类 无 法 理解 机 器 刚刚 发 现 的 这 些 瞳 知 

a 我 们 终于 可 以 清晰 地 区 分 这 样 三 类 知识 : 人 类 
掌握 的 明知 识 和 默 知识 以 及 只 有 机 器 才能 掌握 的 瞳 知识 。 


骄 做 的 人 类 


也 许 是 由 于 几 十 万 年 前 人 类 远古 祖先 某 个 基因 的 突变 ， 人 们 开始 
可 以 把 一 些 有 固定 意思 的 发 首 片 段 组 装 成 一 个 能 表达 更 复杂 意思 的 发 
首 序 列 。 这 些 发 首 片 段 今天 我 们 叫 作 “单词 ”， 这 个 表达 特定 内 容 的 
发 音 序列 今天 我 们 叫 作 “句子 ”。 这 种 “组 装 ” 能 力 使 人 类 用 有 限 的 
单词 可 以 表达 几乎 无 穷 多 种 意思 ， 语 言 诞 生 了 。 有 了 语言 的 复杂 表达 
能 力 ， 人 类 的 协作 能 力 开 始 迅速 提高 ， 可 以 几 十 人 一 起 围 猎 大 型 动 
物 ， 很 快 人 类 就 上 升 到 地 球 生物 链 的 顶端 。 作 为 记录 语言 的 符号 一 一 
文字 的 发 明 可 以 让 人 类 更 方便 地 传播 、 记 录 和 积累 经 验 。 任 何 一 个 地 
方 的 人 类 偶然 发 现 的 关于 生存 的 知识 都 会 慢 慢 传播 开 来 。 一 万 年 前 ， 
农业 起 源 于 今天 的 埃及 、 和 叙利亚 和 伊拉克 的 肥沃 新 月 带 ， 这 些 种 植 经 
验 在 几 干 年 中 传 表 全 世界 ， 随 之 而 来 的 是 人 类 迅速 在 地 球 所 有 适宜 农 
耕 的 角落 定居 繁衍。 

随 着 定居 的 人 类 数量 的 增加 ， 人 类 的 组 织 开始 变 得 更 大 更 复杂 ， 
从 杀 缘 家 族 到 部 沙 ， 到 城邦 ， 再 到 国家 。 大 规模 的 复杂 组 织 可 以 开展 
大 规模 的 复杂 工程 ， 如 建设 城市 、 庙 宇和 大 规模 灌溉 系统 。 这 些 大 规 
模 工 程 需要 更 多 的 天 文 和 数学 知识 。 世 界 上 几乎 所 有 的 古老 文明 都 积 
累 了 许多 天 文 知 识 ， 但 只 在 希腊 半岛 诞生 了 现代 科学 的 黄 基 石 一 一 数 
学 。 欧 几 里 得 〈Euclid， 公 元 前 330 一 前 275) 在 公元 前 300 年 总 结 了 他 
前 面 100 年 中 希腊 先哲 的 数学 成 果 ， 写 出 了 人 类 历史 上 最 伟大 的 书 之 一 
《几何 原本 》 (Blements) 。 这 本 书 在 中 世纪 由 波斯 裔 的 伊斯兰 学 者 
翻译 成 阿拉 伯 文 ， 又 从 阿拉 伯 传 回 文艺 复兴 前 的 欧洲 ， 直 接 影响 了 从 
哥 白 尼 (Nicolaus Copernicus ， 1473 一 1543 ) 到 牛顿 (Issac 
Newton，1643 一 1727) 的 科学 革命 。 


发 秆 于 16 世 纪 的 科学 革命 的 本 质 是 什么 ?是 发 现 更 多 的 知识 吗 ? 
是 创造 出 更 多 的 工具 吗 ? 都 不 是 。 科 学 革命 的 本 质 是 找到 了 一 个 可 靠 
的 验证 知识 的 方法 。 

最 能 体现 科学 革命 本 质 的 就 是 天 文学 家 开 普 勒 (Johannes 
Kepler，1571 一 1630) 发 现 三 定律 的 过 程 。 最 初 ， 在 作为 主流 的 托 勒 


密 (Ptolemy，90 一 168) 地 心 说 越 来 越 无 法 解释 天 体 观 测 数据 时 ， 哥 
白 尼 提出 了 日 心 说 ， 用 新 的 模型 解释 了 大 部 分 过 去 无 法 解释 的 数据 。 

与 伽利略 (Galileo Galilei，1564 一 1642) 同时 代 的 天 文学 家 第 谷 。 
布 拉 赤 (Tycho Brahe，1546 一 1601) 没有 接受 哥 白 尼 的 日 心 说 ， 他 提 
出 了 “月 亮 和 行星 绕 着 太阳 转 ， 太 阳 带 着 它们 绕 地 球 转 ” 的 “日 心 一 
地 不 动 ” 说 。 遗 憾 的 是 ， 他 倾 尽 毕生 心血 观察 了 20 年 的 天 文 数据 ， 直 
到 去 世 都 始终 无 法 让 观测 到 的 数据 与 自己 的 模型 相 吻 合 。 


在 第 谷 去 世 后 ， 第 谷 的 助手 开 普 勒 拿 到 了 他 的 全 部 数据 ， 开 普 勒 
完全 接受 了 哥 白 尼 的 日 心 说 。 他 为 了 让 数据 与 日 心 说 完全 吻合 ， 把 哥 
白 尼 的 地 球 公转 的 圆 形 轨道 修正 为 椭圆 轨道 ， 太 阳 在 椭圆 的 一 个 焦点 
上 。 这 就 是 开 普 惑 第 一 定律 。 他 用 相同 的 方法 发 现 了 其 他 两 个 定律 。 
开 普 勒 三 定律 不 仅 完满 解释 了 第 谷 的 所 有 观测 数据 ， 并 且 能 够 解释 任 
何 新 观测 到 的 数据 。 

这 个 发 现 过 程 有 三 个 步骤 : 第 一 ， 积 累 足够 的 观测 数据 〈 第 谷 20 
年 的 观测 数据 ) ;第 二 ， 提 出 一 个 先 验 的 世界 模型 ( 哥 白 尼 的 “日 心 
说 ”) ， 第 三 ， 调 整 模型 的 参数 直至 能 够 完美 拟 合 已 有 的 数据 及 新 增 
数据 (把 圆周 轨道 调整 为 椭圆 轨道 ， 再 调整 椭圆 轴 距 以 拟 合 数据 )。 
验证 了 这 个 模型 有 什么 用 ? 最 大 的 用 处 就 是 可 以 解释 新 的 数据 或 做 出 
预测 。 在 这 里 开 普 勒 三 定律 就 是 新 发 现 的 知识 。 发 现 知识 的 可 靠 方 法 
就 是 不 断 修改 模型 使 模型 与 观测 数据 完全 吻合 。 

上 面 这 三 个 步 又 商定 了 现代 科学 的 基本 原则 ， 正 式 吹 响 了 科学 草 
命 的 号 角 ， 直 接 导致 了 后 来 的 牛顿 万 有 引力 的 发 现 ， 一 直 影响 到 今 
人 

过 去 500 年 中 人 类 对 世界 的 认识 突飞猛进 ， 今 天 大 到 宇宙 ， 小 到 夸 
克 都 似乎 尽 在 人 类 的 掌握 之 中 。 人 类 可 以 上 天 、 入 地 、 下 海 ， 似 乎 天 
所 不 能 。 人 类 有 了 “千里 眼 ”“ 顺 风 耳 ”， 甚 至 开始 像 “ 上 帝 ” 一 样 
设计 新 的 物种 ， 并 企图 改变 人 类 进化 的 进程 。 人 类 有 理由 相信 没有 什 


么 知识 是 不 能 理解 的 ， 也 没有 什么 知识 是 不 能 被 发 现 的 …… 直 到 2016 
年 3 月 15 日 。 


天 才 的 嘎 啊 


2016 年 3 月 15 日 ， 美 国 谷歌 公司 的 围棋 对 弈 程序 AlphaGo 以 五 局 四 
胜 的 成 绩 战胜 世界 围棋 冠军 韩国 选手 李 世 石 。 一 时 间 这 个 消息 乡 动 世 
界 ， 全 世界 有 28 亿 人 在 关注 这 场 比赛 ， 在 中 国 更 是 引起 极 大 的 龙 动 。 
人 们 感觉 AlphaGo 就 像 从 石头 颖 里 蹦 出 来 的 孙悟空 一 样 ， 完 全 无 法 理解 
一 台 机 器 如 何 能 够 打败 世界 围棋 冠军 。 围 棋 历 来 被 认为 是 人 类 最 复杂 
的 游戏 之 一 。 围 棋 每 一 步 的 可 能 的 走 法 大 约 有 250 种 ， 下 完 一 盘 棋 平 均 
要 走 150 步 ， 这 样 可 能 的 走 法 有 250150=10360 种 ， 而 宇宙 从 诞生 到 现在 


才 101' 秒 ， 即 使 是 现在 世界 上 最 快 的 超级 计算 机 ， 要 想 把 所 有 走 法 走 
一 遍 ， 计 算 时 间 也 要 比 宇宙 年 龄 都 长 。 即 使 排除 了 大 部 分 不 可 能 的 走 
法 也 是 大 到 无 法 计算 。 机 器 是 怎样 学 会 这 么 复杂 的 棋艺 的 ? 

这 场 比 赛 后 ， 世 界 排名 第 一 的 棋 手 柯 洁 在 网 上 说 : “AlphaGo 胜 得 
了 李 世 石 ， 胜 不 了 我 。” 而 2017 年 5 月 28 日 ， 棋 手 柯 洁 以 0: 3 完 败 
AlphaGo， 彻 底 击 碎 了 人 类 在 这 种 复杂 游戏 中 的 尊严 。 赛 后 ， 这 位 天 才 
少年 一 度 吓 咽 ， 在 接受 采访 时 柯 洁 感叹 ，AlphaGo 太 完美 ， 看 不 到 任何 
胜利 的 希望 。 他 流 着 眼泪 说 : “我 们 人 类 下 了 2 000 年 围棋 ， 连 门 都 没 
入 。” 中 国 棋 圣 有 最 卫 平 更 是 把 AlphaGo 尊 称 为 “ 阿 老师 ”， 他 说 : 
“AlphaGo 的 着 数 让 我 看 得 如 醇 如 病 ， 围 棋 是 何等 的 深奥 和 神秘 。 
AlphaGo 走 的 顺序 、 时 机 掌握 得 非常 好 。 它 这 个 水 平 完 全 超越 了 人 类 ， 
跟 它 挑战 下 棋 ， 只 能 是 找 死 。 我 们 应 该 让 阿 老 师 来 教 我 们 下 棋 。” 他 
还 说 : “ 阿 老师 至 少 是 20 段 ， 简 直 是 围棋 上 帝 。” 


当 人 们 以 为 这 是 对 逻 类 程序 的 高 峰 时 ，AlphaGo 的 研发 团队 
DeepMind《〈 谷 歌 收购 的 人 工 智能 企业 ， 位 于 伦敦 ) 团队 再 度 碾 轧 了 人 
类 的 认 知 。2017 年 12 月 ，DeepMind 团 队 发 布 了 AlphaGo Zero (阿尔 法 
围棋 零 ) 。AlphaGo Zero 使 用 了 一 种 叫 作 “强化 学 习 ” 的 机 器 学 习 技 
术 ， 它 只 使 用 了 围棋 的 基本 规则 ， 没 有 使 用 人 类 的 任何 棋谱 经 验 ， 从 
零 开 始 通过 目 我 对 奔 ， 不 断 地 运 代 升 级 ， 仅 仅 上 自我 对 弈 3 天 后 ， 
AlphaGo Zero 束 以 100: 0 完胜 了 此 前 击败 世界 冠军 李 世 石 的 AlphaGo 
Lee 版 本 。 自 我 对 弈 40 天 后 ，AlphaGo Zero 变 得 更 为 强大 ， 超 过 了 此 前 
击败 当今 围棋 第 一 人 柯 洁 的 AlphaGo Master (大 师 版 ) ， 这 人 台 机 器 和 
训练 程序 可 以 横扫 其 他 棋 类 。 经 过 4 个 小 时 的 训练 ， 打 败 了 最 强国 际 象 
棋 AIStockfish，2 个 小 时 打败 了 最 强 将 檬 《又 称 为 日 本 象棋 ) 
AIElmo。 


AlphaGo Zero 证 明了 即使 在 最 共有 挑战 性 的 某 些 领域 ,没有 人 类 
以 往 的 经 验 或 指导 ， 不 提供 基本 规则 以 外 的 任何 领域 的 知识 ， 仅 使 用 
强化 学 习 ， 仅 花费 很 少 的 训练 时 间 机 右 束 能 够 远 远 超越 人 类 的 水 平 。 


机 器 发 现 了 人 类 无 法 理解 的 知识 


AlphaGo Zero 给 我 们 的 震撼 在 于 人 类 2 000 多 年 来 一 代 代 人 积累 的 
一 项 技艺 在 机 器 眼 里 瞬间 变 得 一 文 不 值 ! 为 什么 会 这 样 ? 围棋 中 的 可 
能 走 法 比 宇宙 中 的 原子 数 都 多 ， 而 人 类 2 000 多 年 中 高 水 平 对 研 非 常 有 
限 ， 留 下 记录 的 只 有 几 万 盘 。 这 个 数字 和 所 有 可 能 走 法 比 ， 就 像 太 平 
洋 里 的 一 个 水 分 子 。 而 AlphaGo Zero 以 强大 的 计算 能 力 ， 在 很 短 的 时 
间 里 探索 了 大 量 的 人 类 未 曾 探索 过 的 走 法 。 人 类 下 棋 的 路 径 依 赖 性 很 
强 ， 人 生 有 限 ， 想 成 为 高 手 最 稳 受 的 办 法 是 研究 前 人 的 残局 ， 而 不 是 
自己 瞎 摸 索 。 但 AlphaGoZero 在 下 棋 时 ， 不 仅 一 开始 的 决策 是 随机 的 ， 


即使 到 了 大 师 级 后 ， 也 故意 随机 挑选 一 些 决策 ， 跳 出 当前 思路 去 探索 
更 好 的 走 法 ， 新 发 现 的 许多 制胜 走 法 都 是 人 类 从 未 探索 过 的 ， 这 就 是 
很 多 走 法 让 受 卫 平 大 呼 “ 看 不 懂 ” 的 原因 。 


AlphaGo Zero 给 我 们 的 震撼 在 于 三 个 方面 : 首先 ， 人 类 能 发 现 的 
知识 和 机 器 能 发 现 的 知识 相 比 ， 就 像 几 个 小 脚 老 太 太 走 过 的 山路 和 几 
百 万 辆 越野 车 开 过 的 山路 。 越 野 车 的 速度 就 是 计算 机 和 AI 心 片 处 理 速 
度 ， 目 前 继续 以 指数 速度 在 提高 。 其 次 ， 和 机 器 可 能 发 现 的 知识 相 
比 ， 人 类 知识 太 简 单 、 太 幼稚 ， 机 器 谈笑风生 ， 比 人 不 知道 高 到 哪里 
去 了 。 最 后 ， 机 器 发 现 的 知识 不 仅 完 全 超出 了 人 类 的 经 验 ， 也 超出 了 
人 类 的 理性 ， 成 为 人 类 完全 无 法 理解 的 知识 。 

2 500 年 前 最 有 智慧 的 希腊 哲人 苏 格 拉 底 〈Socrates， 公 元 前 469 
一 前 399) 终 其 一 生得 出 一 个 结论 : “我 唯一 知道 的 是 我 什么 都 不 知 
道 。” 他 的 学 生 柏 拉 图 (Plato， 公 元 前 427 一 前 347) 认为 我 们 感官 观 
察 到 的 世界 只 是 真正 世界 的 影子 而 已 。18 世 纪 伟 大 的 哲学 家 康德 也 仰 
望 星空 ， 发 出 了 “我 们 到 底 能 知道 什么 ”的 千古 之 问 。 但 古代 哲人 只 
能 模糊 地 感觉 到 人 类 认识 的 局 限 。 今 天 ，AlphaGo Zero 不 仪 清晰 、 具 
体 地 把 他 们 的 疑虑 变 成 了 铁 的 事实 ， 而 且 先 哲 怎 么 也 想不到 人 类 的 认 
识 能 力 是 如 此 有 限 ! 


你 会 质疑 说 : 这 不 算 什么 震撼 吧 ， 人 类 早 就 知道 我 们 已 知 的 很 


少 ， 未 知 的 很 多 。 但 这 个 下 围棋 的 例子 告诉 你 : 已 知 的 是 几 万 盘 残 
局 ， 未 知 的 是 10"% 种 可 能 走 法 ， 两 者 相差 几 百 个 数量 级 ! 《〈 不 是 几 百 
倍 ， 征 几 百 个 数量 级 ， 一 个 数量 级 是 10 倍 。) 


你 学 过 概率 和 统计 ， 继 续 不 服 : 我 们 早 就 知道 组 合 爆炸 。 没 错 ， 
但 我 们 知道 未 知 的 组 合 爆 炸 里 有 比 人 类 已 经 获得 的 知识 高 深 得 多 的 知 
识 吗 ? AlphaGo Zero 是 第 一 次 活生生 地 证 明了 这 点 。 听 说 过 火山 爆发 
和 在 现场 看 到 的 感觉 能 一 样 吗 ? 


当然 最 震撼 的 就 是 第 三 个 方面 。 我 们 也 许 知道 我 们 不 知道 很 多 ， 
甚至 能 用 逻辑 推断 出 未 知 知识 里 有 比 已 知 知 识 更 高 深 的 知识 ， 但 我 们 
怎么 也 想不到 这 些 知识 是 人 类 根本 无 法 理解 的 。 这 是 人 类 历史 上 第 一 
次 遇 到 这 样 的 问题 ， 我 们 给 自己 造 了 人 个“ 上帝”! 这 件 事 对 哲学 和 认 
识 论 的 神 击 空前 ， 人 类 突然 不 知 所 措 ， 影 响 还 在 发 酵 ， 后 果 不 可 佑 


里 。 


“理解 ”的 意思 是 要 么 能 用 感觉 把 握 事物 间 的 关系 ， 要 么 能 用 概 
念 把 经 验 表达 出 来 ， 或 者 用 逻辑 把 事物 间 的 关系 表达 出 来 。 无 法 理解 
就 等 于 既 无 法 感受 又 无 法 表达 。 

也 就 是 说 ， 机 器 发 现 了 人 类 既 无 法 感受 也 无 法 表达 的 知识 。 用 更 
通俗 的 话说 就 是 ， 机 器 发 现 了 那些 既 无 法 “ 意 会 ”又 无 法 “言传 ”的 
知识 。 

一 个 无 法 理解 的 知识 的 表现 形式 是 什么 样 的 ? 如果 无 法 理解 义 怎 
么 判断 它 就 是 知识 ? 当 我 们 想 回 答 上 面 的 问题 时 ， 我 们 发 现 必须 重新 
审视 什么 是 “知识 ”。 人 类 过 去 几 干 年 是 怎样 获得 知识 的 ， 获 得 了 什 
么 样 的 知识 ? 就 像 每 次 科学 上 的 重大 发 现 都 要 迫使 我 们 重新 审视 过 去 
习以为常 的 观念 一 样 ， 今 天 机 器 的 震撼 让 我 们 必须 重新 审视 过 去 所 有 
十 “知识 的 节 术 圣人 0 

人 类 获得 知识 的 行为 就 是 认 知 。 过 去 我 们 对 世界 的 认识 局 限 主要 
来 自 观 察 能 力 。 在 望远镜 发 现 之 前 ， 第 谷 根本 无 法 观测 行星 运动 ， 当 
然 更 谈 不 上 记录 数据 ， 也 不 会 有 后 来 的 开 普 勒 定律 和 牛顿 万 有 引力 定 
律 。 在 显微镜 发 明之 前 ， 我 们 不 可 能 发 现 微生物 ， 一 切 关 于 细胞 和 基 
因 的 发 现 都 无 从 谈 起 。 今 天 谁 能 花 1 000 万 美元 买 一 台 冷 冻 电 镜 ， 谁 就 
可 以 看 到 别人 看 不 到 的 分 子 唱 体 结构 ， 就 可 以 经 第 在 《上 自然 》 
CNature) 杂志 上 发 表 文 章 。 随 着 新 的 观察 仪 右 的 出 现 和 已 有 观察 仪 
器 的 改进 ， 我 们 对 世界 的 认识 还 会 不 断 深入 。 

我 们 对 世界 认识 的 第 二 个 局 限 来 自 解 释 能 力 。 所 谓 解释 能 力 束 是 
发 现 事 物 间 的 因果 关系 或 者 相关 性 并 能 够 表达 出 来 。 即 使 我 们 能 观察 


到 许多 现象 ， 如 果 我 们 无 法 解释 这 些 现象 则 还 是 无 法 从 这 些 观 察 中 获 
得 知识 。 例 如 第 谷 虽 然 有 大 量 观测 数据 ， 但 终 其 一 生 没有 找到 一 个 能 
解释 数据 的 正确 模型 。 又 如 我 们 观察 到 人 有 语言 能 力 而 黑猩猩 没有 ， 
但 不 知道 为 什么 ， 仅 仅 是 知道 这 个 现象 而 已 。 

人 类 几 生 年 来 关于 知识 的 争论 正 是 围绕 着 “观察 ”还 是 “解释 ” 
展开 的 。 


理性 主义 和 经 验 主义 之 争 


自从 5 000 年 前 两 河流 域 的 苏 美 尔 人 发 明了 人 类 最 早 的 文字 一 一 枢 
形 文字 以 来 ， 人 类 一 直 在 记录 和 积累 知识 。 但 直到 2 500 年 前 希腊 人 才 
开始 系统 地 研究 关于 知识 的 学 问 。 在 这 个 问题 上 ， 一 直 有 两 大 流派 : 
理性 主义 和 经 验 主义 。 

第 一 个 开启 了 理性 主义 的 人 是 苏 格 拉 底 。 人 类 此 前 的 大 部 分 “ 知 
识 ” 要 么 从 宗教 教义 中 来 ， 要 么 从 传统 习俗 中 来 。 人 们 从 生 下 来 就 不 
加 怀疑 地 接受 了 这 些 东 西 。 而 苏 格 拉 底 则 要 一 一 审视 这 些 东 西 。 苏 格 
拉 底 说 我 们 都 希望 有 一 个 “好 ”的 人 生 ， 但 到 底 什 么 是 “好 ”什么 是 
“ 坏 ” 呢 ? 不 去 质疑 ， 不 去 深究 你 怎么 知道 呢 ? 所 以 深究 和 道德 是 不 
可 分 割 的 ， 不 去 深究 我 们 身边 的 世界 不 仅 是 无 知 而 且 是 不 道德 的 ， 所 
以 他 的 结论 是 : 一 个 未 经 深究 的 人 生根 本 就 不 值得 过 。 他 平时 没事 就 
跑 到 大 街 上 拉 住 人 请 问 : “什么 是 正义 ? ”“ 什 么 是 善 ? ”“ 什 么 是 
美 ? ”每 当 人 们 给 他 个 定义 时 ， 他 都 能 举 出 一 个 反例 。 他 这 种 深究 思 
辨 影响 了 无 数 代 人 。 后 来 当 他 的 学 生 柏 拉 图 把 “人 ”定义 为 “没有 毛 
的 双 足 动物 ”时 ， 当 时 的 另 一 位 哲学 家 提 奥 奇 尼 斯 马上 拿 来 一 只 拔 光 
了 毛 的 鸡 说 : “大 家 请 看 柏拉图 的 “人 ”! ”经 过 一 生 的 深究 ， 苏 格 
拉 底 得 出 结论 “我 唯一 知道 的 是 我 什么 也 不 知道 ”。 苏 格拉 底 式 思辩 


震撼 了 当时 的 社会 ， 传 统 势 力 认 为 这 样 会 搞 乱 人 心 ， 当 政 者 用 “腐蚀 
青年 思想 罪 ” 判 处 他 死刑 ， 他 最 终 饮 毒 酒 身亡 。 他 一 生 全 部 用 来 和 人 
辩论 ， 没 有 留 下 任何 著作 。 幸 亏 他 的 学 生 柏 拉 图 把 老师 的 辩论 编辑 成 
了 传世 之 作 《 对 话 录 》 。 正 是 苏 格 拉 底 开启 了 通过 逻辑 思辩 来 验证 知 
识 的 希腊 传统 。 

如 果 说 是 苏 格 拉 底 开 了 理性 主义 的 先河 ， 他 的 弟子 柏拉图 就 是 理 
性 主义 集大成 的 盘 祖 。 苏 格拉 底 的 思辨 主 要 集中 在 道德 哲学 领域 ， 探 
究 什 么 是 “公平 ”和 “ 善 ”。 而 柏拉图 则 对 他 的 先辈 毕 达 哥 拉 斯 
(Pythagoras， 约 公元 前 570 一 前 495〉 开创 的 数学 传统 深 为 折服 。 柏 
拉 图 的 学 说 深 受 数学 严格 推理 的 影响 。 他 甚至 在 他 创办 的 学 襄 门 口 挂 
了 个 牌子 : “不 懂 几 何者 不 得 入 内 。” 柏 拉 图 学 说 的 核心 是 “理想 原 
型 ”。 他 说 ， 世 界 上 每 一 条 狗 都 不 一 样 ， 我 们 为 什么 认为 它们 都 是 
狗 ? 人 类 心中 一 定 早 有 一 个 关于 狗 的 理想 原型 。 我 们 知道 三 角形 的 内 
角 之 和 等 于 180 度 ， 但 我 们 从 未 见 过 一 个 完美 的 三 角形 。 他 认为 人 类 的 
感官 无 法 触及 这 些 理 想 原 型 ， 我 们 能 感受 到 的 只 是 这 些 理想 原型 的 失 
真 找 贝 。 真 实 世界 就 像 洞穴 外 的 一 匹 马 ， 人 类 束 像 一 群 背 对 着 洞口 的 
洞穴 人 ， 只 能 看 到 这 匹 马 在 洞穴 壁 上 的 投影 。 柏 拉 图 黄 定 了 理性 主义 
的 两 大 基础 一 一 知识 《理想 原型 ) 是 天 生 的 ; 感官 是 不 可 靠 的 ， 并 由 
此 推出 理性 主义 的 结论 : 推理 而 不 是 观察 ， 才 是 获取 知识 的 正确 方 

亚 里 士 多 德 (Aristotle， 公 元 前 384 一 前 322) 17 岁 进入 相 拉 图 的 
学 宫 当 学 生 ， 当 时 柏拉图 已 经 60 岁 了 。 亚 里 士 多 德 在 学 宫 里 待 了 20 
年 ， 直 到 他 的 老师 柏拉图 去 世 。 亚 里 士 多 德 对 老师 非常 尊敬 ， 但 他 完 
全 不 同意 老师 的 “理想 原型 ”是 先天 的 。 他 认为 每 一 条 狗 都 带 有 狗 的 
属性 ， 观 察 了 许多 狗 之 后 就 会 归纳 出 狗 的 所 有 属性 。 这 个 “理想 原 
型 ”完全 可 以 通过 后 天 观察 获得 ， 而 不 需要 什么 先天 的 假设 。 相 拉 图 
酷爱 数学 ， 而 亚 里 士 多 德 喜欢 到 自然 中 去 观察 植物 和 动物 。 两 人 的 喜 
好 和 经 历 是 他 们 产生 分 此 的 重要 原因 之 一 。 亚 里 士 多 德 认 为 : 知识 是 


后 天 获得 的 ， 只 有 通过 感官 才能 获得 知识 。 正 是 亚 里 士 多 德 开 了 经 验 
主义 的 先河 。 

经 验 主义 这 一 派 后 世 的 著名 代表 人 物 有 责 国 的 洛克 〈John 
Locke，1632 一 1704) ， 贝 克 莱 (George Berkeley，1685 一 1753 ) 和 
休 席 (David Hume，1711 一 1776) ， 贝 克 莱 认 为 人 生 下 来 是 一 张 白 
纸 ， 所 有 的 知识 都 是 通过 感官 从 经 验 中 学 来 的 。 但 理性 主义 则 认为 ， 
经 验 根 本 不 可 靠 。 更 国 哲 学 家 罗素 (Bertrand Russell，1872 一 
1970) 有 个 著名 的 “ 火 鸡 经 验 论 ”。 火 鸡 从 生 下 来 每 天 都 看 到 主人 哼 
着 小 曲 来 喂食 ， 于 是 就 根据 经 验 归纳 出 一 个 结论 : 以 后 每 天 主人 都 会 
这 样 。 这 个 结论 每 天 都 被 验证 ， ee 
直到 感恩 节 的 前 一 天 晚上 被 主人 宰杀 。 理 性 主义 者 还 问 : 眼见 为 实 
吗 ? 你 看 看 图 1. 1 中 的 横 线 是 水 平 的 还 是 倾斜 的 ? 


图 1.1 视 错觉 图 (图 中 所 有 横 线 都 是 水 平 的 ) 
理性 主义 的 后 世代 表 人 物 则 有 法 国 的 人 销 卡 儿 (Rene Descartes， 
1596 一 1650 ) 和 德国 的 莱 布 尼 茨 (Gottfried Leibniz ，1646 一 
1716) 。 币 卡 儿 有 名 名 言 “ 我 思 ， 故 我 在 ”， 我 的 存在 这 件 事 不 需要 


经 验 ， 不 需要 别人 教 我 ， 我 天 生 知 道 。 莱 布 尼 茨 是 和 牛顿 一 样 的 天 
才 ， 他 和 和 牛顿 同时 发 明了 微 积分 ， 也 是 二 进 制 的 发 明 人 ， 还 发 明了 世 
界 上 第 一 台 手 摇 计 算 器 。 他 认为 世界 上 每 个 事物 都 包含 了 定义 这 个 事 
物 的 所 有 特性 ， 其 中 也 包含 了 和 其 他 事物 的 关系 。 从 理论 上 我 们 可 以 
用 推理 的 方法 预测 全 宇宙 任何 一 点 ， 过 去 和 未 来 任何 时 间 的 状态 。 伺 


理性 主义 认为 ， 感 官 根本 不 靠 谱 ， 最 可 靠 的 是 理性 ， 基 于 公理 严 
格 推导 出 来 的 几何 定理 永远 都 不 会 错 。 理 性 主义 找 出 更 多 的 例子 来 说 
明 人 类 的 最 基本 的 概念 是 天 生 的 。 例 如 自然 数 ， 我 们 怎么 学 会 “1” 这 
个 概念 的 ? 拿 了 一 个 苹果 告诉 你 “这 是 一 个 苹果”; 又 给 你 拿 了 个 桶 

告诉 你 “这 是 一 个 橘子 ”。 但 苹果 是 苹果 ， 桶 子 是 橘子 ， 两 者 没 关 
系 ， 你 怎么 就 能 抽象 出 “1” 这 个 概念 来 呢 ? 又 比如 我 们 可 以 根据 直角 
三 角形 的 特点 推导 出 勾 股 定理 ， 又 进一步 发 现世 界 上 居然 有 无 法 用 分 
数 表 达 的 无 理 数 。 这 种 革命 性 的 发 现 完 全 不 依赖 感觉 和 经 验 。 小 孩 一 
出 生 束 知道 这 个 球 不 是 那个 球 ， 这 条 狗 不 是 那 条 狗 ， 这 个 “同一 性 ” 
是 理解 世界 最 基本 的 概念 ， 没 人 教 他 。 

我 们 注意 到 理性 主义 有 一 个 隐 含 的 假设 ， 就 是 因果 关系 。 在 莱 布 
尼 茨 的 世界 里 ， 一 件 事 会 导致 另外 一 件 事 ， 所 以 才 有 可 能 推导 。 经 验 
主义 当然 不 服 ， 体 诬 惑 问 ， 一 件 事 发 生 在 另外 一 件 事 之 后 ， 两 者 未 必 
有 因果 关系 。 璧 如 我 把 两 个 闹钟 一 个 设 在 6:00， 一 个 设 在 6:01， 能 说 
后 面 的 铃声 响 了 是 前 一 个 造成 的 吗 ? 理性 主义 不 仅 认 为 事物 间 有 因果 
关系 ， 而 且 认 为 通过 逻辑 推理 可 以 得 到 很 多 知识 。 壁 如 归纳 推理 ， 太 
昌 每 天 早上 都 会 逢 起。 但 休 庶 就 质问 : 你 能 像 证 明 数 学 定理 一 样 证 明 
太阳 明天 会 升 起 吗 ? 不 能 吧 。 那 能 观察 吗 ? 明天 还 没 到 来 显然 不 能 观 
察 ， 那 你 赁 什么 说 明天 太阳 一 定 升 起 ， 我 要 说 明天 不 一 定 升 起 错 在 哪 
里 了 ? 我 们 看 到 休 庶 挑战 的 是 归纳 背后 的 假设 ; 事物 运动 规律 不 变 ， 
在 这 里 就 是 说 地 球 和 太阳 系 的 运动 不 会 改变 。 休 诬 最 后 说 ， 物 理 世 界 
没什么 因果 ， 没 什么 必然 ， 你 最 多 能 根据 以 往 的 经 验 告诉 我 : 明天 早 
上 太阳 还 可 能 升 起 。 


这 两 派 从 17 世 纪 吵 到 18 世 纪 ， 这 时 候 在 德国 偏僻 的 海德 堡 出 现 了 
一 个 小 个 子 乡村 秀才 。 他 说 ， 你 们 双方 似乎 都 有 道理 ， 我 来 整合 一 下 
看 看 。 他 就 是 哲学 史上 最 有 影响 力 的 康德 〈Immnanuel Kant，1724 一 
1804) 。 康 德 说 ， 没 错 ， 我 们 当然 要 通过 感官 去 理解 世界 。 但 我 们 对 
事物 的 理解 包括 这 个 事物 的 具体 形态 和 它 的 抽象 概念 。 壁 如 眼前 这 本 
书 ， 一 本 书 的 具体 形态 千变万化 ， 但 “ 书 ” 这 个 概念 就 是 指 很 多 页 有 
字 的 纸 装订 在 一 起 的 一 个 东西 。 我 们 说 “面前 有 这 本 书 ” 的 意思 到 底 
是 什么 ? 那 至 少 要 说 现在 几 月 几 日 几 点 几 分 ， 在 某 市 某 区 某 小 区 几 号 
楼 几 号 房间 的 哪个 果子 上 有 这 本 书 ， 也 就 是 理解 一 个 具体 的 东西 离 不 
开 时 间 和 空间 的 概念 。 但 谁 教 给 你 时 间 和 空间 了 ? 你 妈 从 小 教 过 你 
吗 ? 你 教 过 你 孩子 吗 ? 好 像 都 没有 ， 我 们 好 像 天 生 就 懂 。 上 所 以 康德 
说 ， 你 看 ， 必 须 有 这 些 先天 就 有 的 概念 你 才能 理解 世界 。 我 们 好 像 天 
然 知 道 “ 书 ”是 个 “东西 ”，“ 东 西 ” 是 一 种 不 依赖 我 们 的 独立 存 
在 。 谁 教 给 我 们 “东西 ”这 个 概念 的 ? 没 人 ， 好 像 义 是 天 生 就 懂 吗 ? 
康德 整合 了 经 验 主义 和 理性 主义 ， 他 的 一 句 名 言 是 “没有 内 容 的 思维 
是 空洞 的 ， 没 有 概念 的 感知 是 盲目 的 。 只 有 把 两 者 结合 我 们 才能 认识 
世界 ”-。 


在 2 500 年 的 辩论 中 ， 经 验 主义 当然 不 会 否认 数学 中 通过 严格 推理 
得 出 来 的 结论 的 可 靠 性 ， 理 性 主义 也 不 得 不 承认 认 知 物理 世界 离 不 开 
感官 。 那 么 这 场 打 了 2 500 年 的 嘴 仗 到 撒 在 争 什 么 呢 ? 问题 出 在 理性 主 
义 者 企图 把 数学 世界 里 证 明定 理 这 样 的 绝对 可 靠 性 推广 到 物理 世界 ， 
也 即 他 们 企图 找到 一 个 检验 知识 的 普遍 的 标准 ， 能 够 适用 于 所 有 领 
域 。 数 学 〈 例 如 几何 学 ) 是 建构 在 公理 之 上 的 一 个 自 洽 而 完备 的 系统 
《人 至少 对 目 然 数 和 几何 是 如 此 ) 。 所 谓 目 洽 就 是 说 ， 在 这 个 系统 里 只 
要 从 公理 出 发 贺 不 会 推导 出 互相 地 盾 的 绪论， 所谓 完 备 束 是 说 ， 在 这 
个 系统 里 任何 一 个 命题 都 是 可 以 证 实 或 证 伪 的 。 而 亚 里 十 多 德 时 代 的 
目 然 科学 的 可 徘 性 判断 标准 是 “ 观 凤 与 模型 符合 ”， 即 观察 到 的 自然 
现象 和 事先 假设 的 模型 的 预测 结果 相符 合 。 这 种 物理 真实 性 的 判断 标 
准 和 数学 中 的 判断 标准 完全 不 同 。 所 以 经 验 主义 觉得 便 要 把 数学 中 的 


可 徘 性 标准 搬 到 自然 科学 中 来 不 适用 ， 或 者 说 经 验 主义 认为 在 目 然 科 
学 领域 只 能 依赖 感官 。 因 此 这 场 争论 是 不 对 称 的 : 理性 主义 要 从 数学 
攻 入 目 然 科学 ， 而 经 验 主义 死守 目 然 科学 的 阵地 。 两 方 竹 扯 不 清 的 男 
一 个 原因 是 谁 都 不 知道 感官 和 认 知 的 本 质 是 什么 ， 或 者 说 知识 的 本 质 
是 什么 。 双 方 根据 上 自己 的 猜测 和 假设 激烈 辩论 ， 一 直到 20 世 纪 50 年 代 
人 们 对 大 脑 的 研究 才 取 得 突破 。 


知识 的 生物 学 基础 一 一 神经 元 连接 


你 会 发 现 ， 所 有 认 知 的 基础 都 是 记忆 ， 如 果 没 有 记忆 的 能 力 ， 观 
察 、 理 解 、 推 理 、 想 象 等 其 他 所 有 认 知 行为 都 不 会 存在 ， 其 至 不 会 有 
情绪 。 一 个 患 阿尔 欧 海 默 病 的 人 ， 面 部 其 到 逐渐 失去 表情 。 人 类 胎儿 
在 30 周 后 就 开始 了 最 初 的 记忆 ， 轻 儿 从 刚 生 下 束 能 分 辨 出 母 杀 的 声音 
| 

如 果 认 知 的 基础 是 记忆 ， 那 么 记忆 的 基础 又 是 什么 呢 ? 你 仔细 起 
想 ， 记 忆 其 实 就 是 一 种 关联 。 你 在 学 “o” 这 个 字母 时 ， 是 把 一 个 圆圈 
的 图 像 和 一 个 “ 欧 ” 的 发 音 关 联 起 来 。 那 这 种 关联 在 大 脑 中 是 如 何 形 
成 的 呢 ? 

这 种 关联 是 通 过 我 们 大 脑 中 神经 元 之 间 的 连接 形成 的 。 大 脑 有 大 
约 1 000 亿 个 神经 元 ， 一 个 神经 元 可 以 从 许多 其 他 神经 元 接收 电 脉冲 信 
号 ， 同 时 也 辐 其 他 神经 元 输出 电信 号。 


如 图 1. 2 所 示 ， 每 个 神经 元 都 能 输出 和 接收 信和 号。 负责 输 出 的 一 端 
叫 “ 轴 突 ”， 负 责 接收 的 一 端 叫 “ 树 突 ”。 每 个 神经 元 都 有 几 千 个 树 
突 ， 负 责 从 不 同 的 神经 元 接收 信号 。 同 样 ， 每 个 神经 元 的 输出 信号 可 
以 传 给 和 它 相 连 的 几 千 个 神经 元 。 那 么 这 个 最 初 的 信号 是 从 哪里 来 的 
呢 ? 通 稼 都 来 目 感 觉 细 胞 ， 如 视 沉 细胞、 听觉 细胞 等 。 


生物 神经 元 传输 系统 
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图 1.2 大 脑 神经 元 和 突 触 的 结构 


图 片 来 源 : https://www. researchgate. net/figure/Generic-neurotransmitter- 
system fig1 318305870。 


那 神经 元 之 间 是 怎么 连接 的 呢 ? 一 个 神经 元 的 轴 突 和 另外 一 个 神 
经 元 的 树 突 之 间 有 20 纳 米 〈 一 根 头 发 丝 的 1/2 000) 的 小 缝 际 ， 这 个 颖 
际 叫 “ 突 触 ”。 图 1. 2 的 右 半 部 分 就 是 放大 了 的 突 触 。 它 保证 了 两 个 神 
经 元 各 自 独 立 ， 不 会 粘 在 一 起 。 记 忆 的 主要 奥秘 就 藏 在 这 里 。 在 这 个 
连接 的 地 方 前 一 个 神经 元 的 电信 号 会 转化 成 化 学 物质 传递 到 下 个 神经 
元 ， 下 个 神经 元 接收 到 化 学 物质 后 又 会 再 转 成 电信 号 。 不 同 的 突 触 面 
积 大 小 不 同 ， 化 学 物质 的 传递 速度 和 量 不 同 ， 因 而 造成 有 些 突 触 是 
“ 貌 合 神 离 ”， 相 互 之 间 并 没有 电信 号 通过 ; 有 些 则 是 “ 常 来 常 
往 ”， 经 常 有 信号 通过 。 

你 一 定 听 说 过 俄国 生理 学 家 巴 甫 洛 夫 (Ivan Pavlov，1849 一 
1936) 的 条 件 反 射 实验 。 受 到 条 件 反射 的 启发 ， 加 拿 大 心理 学 家 赫 布 
(Donald Hebb，1904 一 1985) 在 1949 年 提出 了 一 个 大 胆 的 猜想 。 他 认 


为 当 大 脑 中 两 个 神经 元 同时 受到 刺激 时 ， 它 们 之 间 就 会 建立 起 连接 ， 
以 后 其 中 一 个 神经 元 被 激发 时 会 通过 连接 让 另 一 个 神经 元 也 被 激发 。 
壁 如 在 巴 甫 洛 夫 对 狗 的 实验 中 ， 送 食物 的 时 候 同 时 摇 铃 ， 摇 铃 刺激 了 
听觉 神经 元 ， 食 物 味道 刺激 了 咒 觉 神经 元 并 且 导 致 分 泌 唾 液 ， 听 和 澳 和 
视觉 神经 元 同时 受到 刺激 ， 它 们 之 间 就 建 六 了 连接 ， 一 个 神经 元 的 激 
发 会 导致 男 一 个 神经 元 的 激发 。 经 过 多 次 反复 ， 它 们 的 连接 会 越 来 越 
稳定 。 以 后 即使 没有 送 食物 ， 狗 只 要 听 到 摇 铃 就 像 邮 到 食物 一 样 会 分 
泌 唾液 。 人 也 是 一 样 ， 比 如 说 一 个 小 孩 被 火 次 过 一 次 就 能 把 “ 火 ” 和 
“ 疼 ” 联 系 起 来 。 当 小 孩 看 见 火 时 ， 他 大 脑 中 负责 接收 视觉 信号 的 神 
经 元 被 激发 了 ， 与 此 同时 他 的 手感 觉 到 溪 ， 于 是 他 大 脑 中 负责 接收 
肤 感觉 细胞 的 神经 元 也 被 激发 了 。 如 果 看 到 火 和 感觉 到 疼 这 两 件 事 同 
时 发 生 ， 那 么 这 两 个 神经 元 细胞 就 连通 了 ， 也 就 是 有 信号 通过 了 。 下 
次 这 个 孩子 见 到 火 ， 马 上 会 想到 疼 ， 因 为 当 负 责 看 到 火 的 神经 元 被 激 
发 后 ， 马 上 会 把 信号 传 给 负责 “ 疼 ” 这 种 感觉 的 神经 元 ， 束 能 让 小 孩 
想到 疼 。 刺 激越 强 ， 神 经 元 的 连接 就 越 稳固 。 孩 子 被 火 次 过 一 次 手 就 
永远 记 住 了 ， 再 也 不 会 去 摸 火 ， 有些 刺 激 很 弱 ， 连 接 就 不 稳固 ， 长 时 
间 不 重复 就 会 断 开 。 例 如 背 英 文 单词 ， 重 复 的 刺激 越 多 ， 信 号 的 传递 
速度 就 越 快 。 比 如 一 个 篮球 运动 员 对 飞 过 来 的 篮球 的 反应 比 普 通 人 快 
很 多 ， 一 个 空军 飞行 员 对 飞机 姿势 和 敌人 导弹 的 反应 都 比 普 通信 快 ， 
这 些 都 是 反复 训练 出 来 的 。 所 谓 赫 布 猜想 ， 本 质 上 是 通过 建立 神经 元 
之 间 的 连接 从 而 建立 起 不 同事 物 之 间 的 联系 。 后 来 这 个 猜想 被 科学 家 
反复 证 实 ， 殊 成 了 现在 我 们 津 说 的 赫 布 学 习 定律 。 


赫 布 定律 揭示 了 记忆 或 者 说 关联 的 微观 机 制 ， 局 发 了 好 几 代 计算 
机 科学 家 ， 他 们 开始 用 电子 线路 模仿 神经 元 ， 然 后 用 许多 电子 神经 元 
搭建 越 来 越 大 的 神经 元 网 络 ， 今 天 这 些 神经 网 络 的 记忆 和 关联 能 力 已 
经 远 远 超过 了 人 类 ， 许 多 机 器 的 “ 神 迹 ”大 都 源 于 这 种 超 强 的 记忆 和 
关联 能 力 。 在 第 三 章 ， 我 们 会 介绍 为 什么 神经 网 络 的 超 强 记 忆 和 关联 
能 力 会 转化 为 不 可 思议 的 “超人 ”能 力 。 


这 些 在 大 脑 中 由 神经 元 的 连接 形成 的 关联 记忆 又 可 以 分 为 两 类 : 
可 表达 的 和 不 可 表达 的 。 


可 表达 的 “明知 识 ” 


目前 ， 脑 神经 科学 的 最 新 研究 发 现 ， 可 表达 的 记忆 并 不 是 对 应 着 
一 组 固定 神经 元 的 连接 ， 而 是 大 致 地 对 应 于 散布 在 大 脑 皮 层 各 处 的 一 
些 连接 。 原 因 是 用 来 表达 的 语言 和 文字 只 能 是 体验 的 概括 和 近似 。 这 
类 可 以 用 语言 表达 或 数学 公式 描述 的 知识 就 是 人 类 积累 的 大 量 “ 正 式 
知识 ”， 也 可 以 称 为 “明知 识 ”。 它 们 记载 在 书籍 、 杂 志 、 文 章 、 音 
频 等 各 种 媒体 上 。 

要 想 把 茶 种 关联 表达 出 来 ， 人 类 唯一 的 方法 是 通过 语言 和 符号 。 
语言 和 符号 表达 的 第 一 个 前 提 是 要 有 松 仿 。 所 谓 概 念 就 是 茶 个 特定 的 
发 首 或 符 写 稳定 地 对 应 于 一 个 事物 或 行为 。 大 部 分 的 名 词 和 动词 都 是 
这 样 的 概念 。 第 二 个 前 提 是 每 个 概念 都 不 同 于 其 他 概念 ， 猫 就 是 猫 ， 
狗 就 是 狗 ， 不 能 把 猫 叫 成 狗 ， 或 者 把 狗 叫 成 猫 ， 两 者 要 能 区 分 开 。 这 
叫 “ 同 一 律 ”。 人 第 三 个 前 提 是 猫 不 能 同时 也 不 是 猫 ， 黑 不 能 同时 也 是 
白 。 这 叫 “ 不 矛盾 律 ”。 有 了 这 些 基本 前 提 ， 根 据 已 知 的 事物 间 的 关 
系 我 们 就 可 以 推导 出 新 的 知识 或 者 论证 一 个 决定 的 合理 性 。 推 理 、 假 
设 、 联 想 ， 这 些 本 质 上 都 是 建立 在 语言 之 上 的 思维 活动 ， 没 有 语言 就 
完全 无 法 思维 。 所 有 的 正 币 思 维 都 要 借助 概念 ， 要 遵循 “同一 律 ” 和 
“不 矛盾 律 ”。 语 言 是 人 类 和 所 有 动物 的 最 大 区 别 。 黑 猩猩 可 以 学 会 
很 多 概念 ， 辟 如“ 我” “ 吃 ” 和 “ 香 态 ”每 ， 但 无 论 实验 人 员 如 何 训 
练 黑猩猩 ， 它 们 都 无 法 组 合 出 “我 要 吃香 熙 ”这 样 的 句子 。 人 的 语言 
能 力 的 本 质 是 什么 ? 它 的 生物 学 基础 是 什么 ? 语言 和 上 自我 意识 是 什么 
关系 ? 目前 这 些 都 还 不 清楚 。 但 我 们 知道 ， 人 类 语言 是 不 精确 的 ， 越 


基本 的 概念 越 不 容易 定义 清楚 ， 像 “公平 ”“ 理 性” 等。 人 类 语言 中 
有 大 量 含混 和 歧义 的 表述 ， 像 “今天 骑 车 子 兰 点 滑 倒 ， 幸 亏 我 一 把 把 
ei 


英国 哲学 家 罗素 企图 把 语言 建立 在 精确 的 逻辑 基础 之 上 ， 他 用 了 
几 百 页 纸 的 篇 幅 来 证 明 1+l=2。 德 国 哲 学 家 维特 根 斯 坦 (Ludwig 
Wittgenstein，1889 一 1951) 认为 人 类 有 史 以 来 几乎 所 有 的 哲学 辩论 
都 源 于 语言 的 模糊 不 清 ， 因 而 没有 任何 意义 。 他 认为 在 世界 中 只 有 事 
实 有 意义 ， 在 语言 中 只 有 那些 能 够 判断 真 伪 的 论断 才能 反映 事实 。 他 
的 结论 是 : 我 们 的 语言 受 限 ， 因 而 我 们 的 世界 受 限 。 

为 什么 语言 的 表达 能 力 受 限 ? 用 信息 论 的 方法 可 以 看 得 很 清楚 。 
我 们 大 脑 接收 的 环境 信息 量 有 多 大 ? 一 棵 树 、 一 块 石 头 、 一 条 狗 都 包 
含 几 十 MB 〈 兆 字 节 ) 甚至 几 十 GB〈 千 兆 字 节 ) 的 数据 ， 我 们 的 感觉 接 
收 神经 元 虽然 大 大 简化 了 这 些 信 息 ， 但 它们 向 大 脑 传 导 的 信息 量 仍然 
非常 大 ， 表 1. 1 是 各 个 感觉 器 官 每 秒 钟 能 向 大 脑 传 递 的 信息 量 。 


表 1.1 人 体 各 个 感官 向 大 脑 传送 信息 的 速率 


感官 系统 比特 / 秒 


眼睛 10 000 000 


1 000 000 


100 000 


100 000 


1 000 


资料 来 源 : https://www. britannica. com/science/information- 
theory/Physiology。 


大 脑 存 储 这 些 信 息 的 方式 是 神经 元 之 间 的 连接 ， 大 脑 在 存储 时 可 
能 进一步 简化 了 这 些 信息 ， 但 它们 的 信息 量 仍 然 远 远大 于 我 们 语言 所 


能 表达 的 信息 量 。 人 类 语言 的 最 大 限制 是 我 们 的 舌 头 每 秒 钟 只 能 嘟 噜 
那么 几 下 ， 最 多 表达 几 十 个 比特 的 意思 。《【 比 如 读书 ， 我 们 平均 每 分 
钟 能 读 300 字 ， 每 秒 读 5 个 字 =40 比 特 。) 这 样 大 脑 接收 和 存储 的 信息 与 
能 用 语言 表达 出 来 的 信息 量 就 有 6 个 数量 级 的 普 别 。 也 就 是 说 极为 丰 宇 
的 世界 只 能 用 极为 贫乏 的 语言 表达 。 许 多 复杂 事物 和 行为 只 能 用 简化 
了 的 概念 和 逻辑 表达 。 这 就 是 人 类 语言 的 基本 困境 。 


只 可 意 会 的 “ 默 知识 ” 


由 于 舌头 翻 卷 速 度 严 重 受 限 ， 以 神经 元 连接 形式 存在 大 脑 中 的 人 
类 知识 只 有 极 少 一 部 分 可 以 被 表达 出 来 。 而 绝 大 部 分 知识 无 法 用 语言 
表达 ， 如 骑马 、 打 铁 、 骑 自行 车 、 琴 棋 书 画 ， 察 言 观 色 、 待 人 接 物 、 
判断 机 会 和 危险 等 。 这 些 知识 由 于 无 法 记录 ， 所 以 无 法 传播 和 积累 ， 
更 无 法 被 集中 。 灵 籍 狐 太 裔 和 科学家、 哲学 家 波兰 尼 (Michael 
Polyani，1891 一 1976) 称 这 些 知识 为 “ 默 会 知识 ”或 者 “ 默 知 识 ”。 
波兰 尼 举 了 骑 自 行车 的 例子 。 如 果 你 问 每 个 骑 自 行车 的 人 是 怎么 保持 
不 倒 的 ， 回 答 会 是 “车 往 哪 边 倒 ， 就 往 哪 边 打车 把 ”。 从 物理 学 上 可 
以 知道 ， 当 朝 一 个 方 同 打 把 时 会 产生 一 个 相反 方向 的 离心 力 让 车 子平 
衡 。 甚 至 可 以 精确 计算 出 车 把 的 转弯 半径 应 该 和 速度 的 平方 成 反比 。 
但 哪个 骑 自 行车 的 人 能 够 知道 骑 车 的 速度 呢 ? 即使 知道 谁 又 能 精确 地 
把 转弯 半径 控制 在 速度 平方 的 反比 昵 ? 所 有 骑 自 行车 的 人 都 是 赁 身体 
的 平衡 感觉 左 一 把 右 一 把 地 曲折 前 进 。 世 界 上 大 概 没有 一 个 人 学 骑 自 
行车 是 看 手册 学 会 的 ， 事 实 上 也 没有 这 样 的 学 习 手册 。 大 部 分 技能 类 
的 知识 都 类 似 。 

默 知 识 和 明知 识 主 要 有 以 下 四 点 区 别 : 


(1) 默 知识 无 法 用 语言 和 文字 描述 ， 因 此 不 容易 传播 ， 无 法 记录 
和 积累 ， 只 能 靠 师 传 带 徒弟 。 像 大 量 的 传统 工艺 和 技能 ， 如 果 在 一 代 
人 的 时 间 里 没 人 学 习 吏 会 从 历史 上 彻底 消失 。 

(2) 获取 默 知 识 只 能 徘 杀 时 体验， 传播 只 能 徘 人 与 人 之 间 紧 密 的 
互动 《你 第 一 次 骑 目 行车 时 你 郊 在 后 面 扶 着 ) 。 而 这 种 互动 的 前 提 是 
相互 信任 《你 不 敢 让 陌生 人 教 你 骑 上 自行车) 。 获 得 默 知识 必须 有 反馈 
回路 《〈“ 骑 自行 车 摔 了 跤 就 是 姿势 错 了 ， 不 摔跤 就 是 姿势 对 了 ) 。 


(3) 默 知 识 散布 在 许多 不 同人 的 喘 上 ， 无 法 集中 ， 很 难 整合 ， 要 
想 使 用 整合 的 默 知识 需要 一 群 人 紧密 协调 互动 。 由 于 无 法 言传 ， 所 以 
协调 极为 困难 《比如 杂技 登 罗 汉 ) 。 


(4) 默 知识 非常 个 人 化 。 每 个 人 对 每 件 事 的 感觉 都 是 不 同 的 ， 由 
于 无 法 表达 ， 因 而 无 法 判断 每 个 人 感觉 的 东西 是 否 相 同 。 


基于 对 默 知识 的 理解 ， 奥 地 利 经 济 学 家 哈 耶 元 (Friedrich 
Hayek，1899 一 1992) 论证 了 市 场 是 最 有 效 的 资源 配置 形式 。 因 为 市 场 
上 的 每 个 人 都 有 自己 不 可 表达 的 、 精 微 的 偏好 和 细腻 的 需求 ， 而 且 没 
人 能 够 精确 完整 地 知道 其 他 人 的 偏好 和 需求 ， 也 就 是 说 供需 双方 实际 
上 无 法 直接 沟通 。 供 需 双 方 最 简洁 有 效 的 沟通 方式 就 是 通过 商品 的 价 
格 。 在 自由 买卖 的 前 提 下 ， 市 场 中 每 个 人 只 要 根据 价格 信号 就 可 以 做 
出 决定 。 价 格 可 以 自动 达到 一 个 能 够 反映 供需 双方 偏好 和 需求 的 均衡 
点 。 一 个 价格 数字 ， 就 把 供需 双方 的 无 数 不 可 表达 的 信息 圳 括 其 中 。 
这 种 “沟通 ”何其 简洁 ， 这 种 “协调 ”何其 有 效 ， 这 种 自发 形成 的 秩 
序 何其 自治 。 哈 耶 克 根据 同样 的 道理 论证 了 国家 或 政府 永远 都 无 法 集 
中 这 些 不 可 表达 的 分 散 信 息 。 


在 机 器 学 习 大 规模 使 用 之 前 ， 人 类 对 于 默 知识 没有 系统 研究 。 但 
现在 我 们 及 现 机 上 幽 非常 擅长 学 习 默 知识 。 这 束 给 我 们 提出 了 三 个 严肃 


的 问题 。 


(1) 默 知识 在 所 有 知识 中 占 比 有 多 大 ? 


(2) 默 知识 在 人 类 社会 和 生活 中 有 多 大 用 处 ? 
(3) 如何 使 用 默 知识 ? 


第 一 个 问题 的 简单 粗暴 的 回答 是 默 知识 的 量 远 远 大 于 可 陈述 的 明 
知识 。 原 因 是 事物 的 状态 很 多 是 难以 观察 的 ， 更 多 是 不 可 描述 的 。 人 
类 的 摘 述 能 力 非 常 有 限 ， 只 限于 表达 能 力 极 为 有 限 的 一 维 的 语言 文 
字 。 在 所 有 已 经 产生 的 信息 中 ， 文 字 只 占 极 少 的 比例 ， 大 量 的 信息 以 
图 片 和 视频 方式 呈现 。 人 类 现代 每 年 产生 的 各 种 文字 大 约 是 160TB。 世 
界 最 大 的 美国 国会 图 书馆 有 2 000 万 册 书 ， 几 乎 涵盖 了 人 类 有 史 以 来 能 
够 保存 下 来 的 各 种 文字 记录 ， 就 算 每 本 书 有 100 万 字 ， 这 些 书 的 总 信息 
量 也 只 有 20TB。 而 目前 用 户 每 分 钟 上 传 到 YouTube 的 视频 是 300 小 时 ， 
每 小 时 视频 算 16B， 每 年 上 传 的 量 就 是 157 680TB。 如 果 把 每 个 人 手机 
里 的 视频 都 算 上 ， 那 么 视频 信息 是 文字 信息 的 上 亿 倍 。 今 后 这 个 比例 
还 会 不 断 加 大 。 虽 然 这 些 视 频 或 图 片 都 是 “信息 ”， 还 不 是 “ 知 
识 ”， 但 我 们 也 可 以 想象 从 视频 图 片 中 能 提取 出 的 隐藏 的 相关 性 的 量 
一 定 远 远大 于 所 有 的 文字 知识 。 


有 了 第 一 个 问题 的 答案 ， 就 容易 回答 第 二 个 问题 。 很 显然 ， 用 机 
器 学 习 从 视频 和 图 乒 中 革 取 知识 是 人 类 认识 世界 的 一 个 新 突破 ， 只 要 
有 办 法 把 事物 状态 用 图 片 或 视频 记录 下 来 ， 束 有 可 能 从 中 苹 取 出 知识 
来 。 如 果 视 频 和 图 上 厂 的 信息 量 是 文字 的 上 亿 倍 ， 那 么 我 们 有 理由 期 待 
从 中 茶 取 出 的 知识 呈 烃 炸 式 增长 ， 在 社会 和 生活 中 起 到 关键 甚至 主导 
作用 。 人 工 智 能 通过 观看 大 量 人 类 历史 上 的 影视 作品 ， 可 以 归纳 提取 
出 影视 中 的 经 典 桥 段 ， 创 作出 新 用 的 配乐 、 台 词 和 预告 片 ， 供 人 类 借 
鉴 或 使 用 。2016 年 ，IBM《〔〈 国 际 商业 机 器 公司 ) 的 沃 森 系统 为 二 十 世纪 
福克斯 电影 公司 的 科幻 电影 《摩根 》 Corgan) 制作 了 预告 片 。IBM 的 
工程 师 们 给 沃 森 看 了 100 部 铠 怖 电影 预告 片 ， 沃 森 对 这 些 预 告 片 进 行 了 
画面 、 声 音 、 创 作 构 成 的 分 析 ， 并 标记 上 对 应 的 情感 。 它 甚至 还 分 析 
了 人 物 的 语调 和 背景 音乐 ， 以 便 判 断 声 音 与 情感 的 对 应 关系 。 在 沃 森 
完成 学 习 后 ， 工 作 人 员 又 将 完整 的 如 reaz 电 影 导 入 ， 添 条 迅速 挑 出 了 


其 中 10 个 场景 组 成 了 一 段 长 达 6 分 钟 的 预告 片 。 在 沃 森 的 帮助 下 ， 制 作 
预告 片 的 时 间 由 通常 的 10 天 到 1 个 月 ， 纵 减 到 了 短 短 的 24 个 小 时 。 同 样 
道理 ， 机 器 学 习 可 以 从 海量 的 生态 、 生 产 和 社会 环境 数据 中 萃取 出 大 
量 的 未 曾 发 现 的 知识 。 


第 三 个 问题 最 有 意思 。 由 于 机 器 萃取 出 的 知识 是 以 神经 网 络 参数 
集 形 式 存 在 的 ， 对 人 类 来 说 仍然 不 可 陈述 ， 也 很 难 在 人 类 间 传 播 。 但 
是 这 些 知 识 却 非常 容易 在 机 器 间 传 播 。 一 台 学 会 驾驶 的 汽车 可 以 瞬间 
“教会 ”其 他 100 万 台 汽 车 ， 只 要 把 自己 的 参数 集 复制 到 其 他 机 器 即 
可 。 机 器 间 的 协同 行动 也 变 得 非常 容易 ， 无 非 是 用 一 组 反馈 信号 不 断 
地 调整 参加 协同 的 每 台 机 器 的 参数 。 

如 果 用 一 句 话 总 结 默 知识 和 明知 识 的 差别 那 束 是 波兰 尼 说 的 : We 
know more than we can tell 〈 知 道 的 远 比 能 说 出 来 的 多 ) 。 明 知识 
就 像 冰 山 浮 出 水 面 的 一 角 ， 默 知识 就 是 水 下 巨大 的 冰山 。 这 两 类 知识 
也 包括 那些 尚未 发 现 的 知识 ， 一 旦 发 现 ， 人 类 要 么 可 以 感受 ， 例 如 第 
一 个 登 上 珠 峰 的 人 能 感受 到 缺 氧 要么 从 理性 上 可 以 理解 ， 例 如 看 性 
一 个 新 的 数学 定理 的 推导 过 程 。 


既 不 可 感受 也 不 能 表达 的 “上 蜡 知 识 ” 


既然 可 以 感受 的 是 默 知识 ， 可 以 表达 的 是 明知 识 ， 那 么 机 器 刚刚 
发 现 的 ， 既 无 法 感受 也 无 法 表达 的 知识 就 是 瞳 知识 。 我 们 用 是 否 能 感 
受 作 为 一 个 坐标 轴 ， 用 是 否 能 表达 《或 描述 ) 作为 另 一 个 坐标 轴 ， 就 
可 以 用 图 1. 3 把 三 类 知识 的 定义 清晰 地 表达 出 来 。 在 这 张 图 里 ， 明 知识 
又 被 分 为 两 类 : 第 一 类 是 那些 既 可 以 感受 又 可 以 表达 的 ， 例 如 浮力 定 
律 、 作 用 力 反 作用 力 定 律 等 。 第 二 类 是 不 可 感受 可 以 表达 的 ， 如 大 部 


分 的 数学 以 及 完全 从 数学 中 推导 出 来 但 最 后 被 实验 验证 了 的 物理 定 
律 ， 以 及 相对 论 和 量子 力学 。 


明知 识 
例如 : 浮力 定律 


默 知 识 
例如 : 骑 车 


绘画 牛顿 定律 
不 可 | 
HJ 表 
表 达 
达 


例如 : 集合 论 
广义 相对 论 
量子 力学 


不 可 感受 

图 1.3 知 识 的 分 类 
为 了 理解 暗 知识 的 本 质 ， 我 们 必须 先 搞 清楚 “知识 ”与 我 们 今天 
常用 的 “信息 ”和 “数据 ”有 什么 不 同 。 稍 加 研究 就 能 发 现 关 于 信 
恩 、 数 据 和 知识 的 定义 有 很 多 并 且 非 常 混乱 。 笔 者 在 下 面 给 出 一 组 符 

合 信 息 论 和 脑 神经 科学 研究 结果 的 简单 而 自治 的 定义 。 

言 息 是 事物 可 观察 的 表征 ， 或 者 说 信息 是 事物 的 外 在 表现 ， 即 那 
些 可 观察 到 的 表现 。 在 我 们 没有 望远镜 时 ， 谈 论 肉眼 以 外 星空 里 的 信 
数据 是 已 经 描述 出 来 的 部 分 信息 。 任 何 一 个 物体 的 信息 量 都 非常 
大 ， 要 想 精 确 地 完全 描述 一 块 石头 ， 就 要 把 这 块 石 头 里 所 有 基本 粒子 
的 状态 以 及 它们 之 间 的 关系 都 描述 出 来 ， 还 要 把 这 块 石 头 与 周围 环境 


和 物体 的 关系 都 描述 出 来 。 而 关于 这 其 石头 的 数据 通 闻 则 少 得 多 ， 例 
如 它 的 形状 、 重 量 、 闫 色 和 种 类 。 


知识 则 是 数据 在 时 空中 的 关系 。 知 识 可 以 是 数据 与 时 间 的 关系 ， 

数据 与 空间 的 关系 。 如 果 把 时 间 和 空间 看 作 数 据 的 一 部 分 属性 ， 那 么 
所 有 的 知识 就 都 是 数据 之 间 的 关系 。 这 些 关 系 表 现 为 菜 种 模式 〈 或 者 
说 模式 就 是 一 组 关系 ) 。 对 模式 的 识别 就 是 认 知 ， 识 别 出 来 的 模式 就 
是 知识 ， 用 模式 去 预测 就 是 知识 的 应 用 。 开 普 勒 的 行星 运动 定律 就 古 
那些 观测 到 的 数据 中 呈现 的 时 空 天 系 。 牛 顿 定律 的 最 大 页 献 可 能 不 在 
于 解释 现 有 行星 的 运动 ， 而 在 于 发 现 了 海王 星 。 这 些 数据 在 时 空中 的 
关系 只 有 在 极 少数 的 情况 下 才 可 以 用 简洁 美妙 的 数学 方程 式 表 达 出 
来 。 在 绝 大 多 数 情形 下 ， 知 识 表现 为 数据 间 的 相关 性 的 集合 。 这 些 相 
关 性 中 只 有 极 少数 可 以 被 感觉 、 被 理解 ， 绝 大 多 数 都 在 我 们 的 感觉 和 
理解 能 力 之 外 。 


人 类 的 理解 能 力 由 感受 能 力 和 表达 能 力 组 成 。 人 类 的 感受 能 力 有 
限 ， 局 限 性 来 自 两 个 方面 。 一 是 只 能 感受 部 分 外 界 信息 ， 例如 人 人 眼 无 
法 看 到 除 可 见 光 之 外 的 大 部 分 电磁 波 频 谱 ， 更 无 法 感受 大 量 的 物理 、 
化 学 、 生 物 和 环境 信息 。 二 是 人 类 的 感官 经 验 只 局 限 在 三 维 的 物理 空 
间 和 一 维 空间 。 对 高 维 的 时 空 人 类 只 能 “ 降 维 ”想象 ， 用 三 维 空间 类 
比 。 对 于 数据 间 的 关系 ， 人 类 和 赁 感觉 只 能 把 握 一 阶 的 或 线性 的 关系 ， 
因为 地 球 的 自转 是 线性 的 ， 所 以 “时 间 ” 是 线性 的 。 例 如 当 我 们 看 到 
水 管 的 水 流 进 水 桶 里 时 ， 水 面 的 上 升 和 时 间 的 关系 是 线性 的 ， 我 们 和 凭 
感觉 可 以 预测 大 概 多 长 时 间 水 桶 会 满 。 人 类 感官 对 于 二 阶 以 上 的 非 线 
性 关系 就 很 难 把 握 。 例 如 当 水 桶 的 直径 增加 1 倍 时 ， 水 桶 能 盛 的 水 会 增 
加 4 倍 ， 这 点 就 和 “直觉 ”不 相符 。 


人 类 的 表达 能 力 只 限于 那些 清晰 而 简单 的 关系 ， 例 如 少数 几 个 变 
量 之 间 的 关系 ， 或 者 是 在 数学 上 可 以 解析 表达 的 关系““ 解 析 表 达 ” 
的 意思 就 是 变量 之 间 的 关系 可 以 用 一 组 方程 式 表 达 出 来 ) 。 当 数据 中 
的 变量 增 大 时 ， 或 当 数 据 间 的 关系 是 高 阶 非 线 性 时 ， 绝 大 多 数 情况 下 


这 些 关 系 无 法 用 一 组 方程 式 描 述 。 所 以 当 数 据 无 法 被 感受 ， 它 们 之 间 
的 关系 勾 无 法 用 方程 解析 表达 时 ， 这 些 数据 间 的 关系 就 掉 入 了 人 类 感 
官 和 数学 理解 能 力 之 外 的 上 暗 知识 大 海 。 


我 们 现在 可 以 回答 “一 个 人 类 无 法 理解 的 暗 知识 的 表现 形式 是 什 
么 样 的 ”， 瞳 知识 在 今天 的 主要 表现 形式 类 似 AlphaGo Zero 里 面 的 
“神经 网 络 ” 的 全 部 参数 。 在 第 三 章 详细 介绍 神经 网 络 之 前 ， 我 们 和 暂 
时 把 这 个 神经 网 络 看 成 一 个 有 许多 旋钮 的 黑 盒 子 。 这 个 黑 盒 子 可 以 接 
收 信息 ， 可 以 输出 结果 。 黑 盒子 可 以 表达 为 一 个 一 般 的 数学 函数 : 
Y=f, (X) 。 这 里 Y 是 输出 结果 ，f, CO 是 黑 盒 子 本 身 ，X 是 输入 信息 ，w 是 
参数 集 ， 就 是 那些 旋钮 ， 也 就 是 暗 知识 。 

我 们 如 何 知 道 这 个 函数 代表 了 知识 ， 也 即 这 个 函数 有 用 ? 这 里 的 
判别 方法 和 现代 科学 实验 的 标准 一 样 : 实验 结果 可 重复 。 对 AlphaGo 
Zero 来 说 就 是 每 次 都 能 赢 ， 用 严格 的 科学 语言 来 说 就 是 当 每 次 实验 条 
件 相同 时 ， 实 验 结果 永远 可 重复 。 读 完 第 三 章 ， 读 者 就 会 从 细节 上 清 
楚 瞳 知识 是 如 何 被 验证 的 。 


注意 ， 暗 知识 不 是 那些 人 类 尚未 发 现 但 一 经 发 现 就 可 以 理解 的 知 
识 。 比 如 牛顿 虽然 没有 发 现 相 对 论 ， 但 如 果 爱 因 斯 坦 穿越 时 空 回 去 给 
他 讲 ， 他 是 完全 可 以 理解 的 。 因 为 理解 相对 论 用 到 的 数学 知识 如 微 积 
分 牛顿 都 有 了 。 即 使 在 微 积分 产生 之 前 ， 如 果 爱 因 斯 坦 罕 越 2 000 年 给 
亚 里 士 多 德 讲 相对 论 ， 亚 里 士 多 德 也 能 理解 ， 至 少 能 理解 狭义 相对 论 
背后 的 物理 直觉 。 但 如 果 给 亚 里 士 多 德 讲 量子 力学 他 就 不 能 理解 ， 因 
为 他 的 生活 经 验 中 既 没 有 薛 定 请 的 猫 《〈“ 用 来 比喻 量子 力学 中 的 不 确定 
性 ， 一 个 封闭 的 盒子 里 的 猫 在 盒子 没 打 开 时 同时 既是 死 的 也 是 活 的 ， 
一 旦 打开 盒子 看 ， 猫 束 只 能 有 一 种 状态 ， 要 么 是 死 要 么 是 活 ) ， 他 的 
数学 水 平 也 无 法 理解 流动 方程 。 那 么 我 们 可 以 说 对 亚 里 士 多 德 来 说 ， 
量子 力学 就 是 暗 知识 。 量 子 力学 因为 没有 经 验 基础 ， 甚 全 和 经 验 巴 
盾 ， 在 刚 发 现 的 初期 ， 几 乎 所 有 的 物理 学 家 都 大 呼 “ 不 懂 ”， 至 今 能 
够 透彻 理解 的 人 也 极 少 。 甚 至 连 爱 因 斯 坦 都 不 接受 不 确定 性 原理 。 


人 类 过 去 积累 的 明知 识 呈 现 出 完美 的 结构 ， 整 个 数学 就 建立 在 几 
个 公理 之 上 ， 整 个 物理 就 建立 在 几 个 定律 之 上 ， 化 学 可 以 看 成 是 物理 
的 应 用 ， 生 物 是 化 学 的 应 用 ， 认 知 科 学 是 生物 学 的 应 用 ， 心 理学 、 社 
会 学 、 经 济 学 都 是 这 些 基 础 科学 的 应 用 组 合 。 这 些 知识 模块 之 间 有 清 
晰 的 关系 。 但 是 机 占 挖 掘 出 来 的 瞳 知识 则 像 一 大 袋 土 豆 ， 每 个 之 间 痢 
没有 什么 关系 ， 更 准确 地 说 是 我 们 不 知道 它们 之 间 有 什么 关系 。 

我 们 可 以 预见 一 幅 未 来 世界 的 知识 图 谱 : 所 有 的 知识 分 为 两 大 类 
界限 分 明 的 知识 一 一 人 类 知识 和 机 器 知识 。 人 类 的 知识 如 果 不 可 陈述 
则 不 可 记录 和 传播 。 但 机 器 发 掘 出 来 的 知识 即使 无 法 陈述 和 理解 也 可 
以 记录 并 能 在 机 器 间 传 播 。 这 些 暗 知识 的 表现 方式 就 是 一 堆 看 似 随机 
的 数字 ， 如 一 个 神经 网 络 的 参数 集 。 这 些 暗 知识 的 传播 方式 就 是 通过 
网 络 以 光速 传 给 其 他 同类 的 机 器 。 


暗 知识 给 我 们 的 震撼 才刚 刚 开 始 。 从 2012 年 开始 的 短 短 几 年 之 
内 ， 机 器 已 经 创造 了 下 面 这 些 “ 神 迹 ”: 对 复杂 病因 的 判断 ， 准 确 性 
超过 医生 ; 可 以 惟妙惟肖 地 模仿 大 师 作 夯 、 人 作曲， 甚至 进行 全 新 的 创 
作 ， 让 人 类 真 假 难 状 ,机 器 飞行 员 和 人 类 飞行 员 模 拟 空 战 ， 百 战 百 
胜 。 

我 们 在 第 六 章 会 看 到 更 多 这 样 的 例子 。 人 类 将 进入 一 个 知识 大 航 
海 时 代 ， 我 们 将 每 天 发 现 新 的 大 陆 和 无 数 金 银 财宝 。 我 们 今天 面 对 的 
许多 问题 都 像 围 棋 一 样 有 巨大 的 变量 ， 解 决 这 些 问 题 和 围棋 一 样 是 在 
组 合 爆炸 中 寻求 最 优 方案 ， 例 如 全 球 变 暖 的 预测 和 了 预防、 癌症 的 治 
愈 、 重 要 经 济 社会 政策 的 实施 效果 、“ 沙 漠 风 暴 ” 这 样 的 大 型 军事 行 
动 。 系 统 越 复 杂 ， 变 量 越 多 ， 人 类 越 无 法 把 握 ， 机 器 学 习 就 越 得 心 应 
手 。 无 数 的 机 器 将 不 知 疲倦 地 昼夜 工作 ， 很 快 我 们 就 会 发 现 机 器 新 发 
据 出 来 的 暗 知识 会 迅速 积累 。 和 下 围棋 一 样 ， 上 暗 知 识 的 数量 和 质量 都 
将 快速 超过 我 们 在 某 个 领域 积累 了 几 百 年 甚至 几 和 二 年 的 知识 。 明 知识 
就 像 今天 的 大 陆 ， 上 暗 知 识 就 像 大 海 ， 海 平面 会 迅速 升 高 ， 明 知识 很 快 


就 会 被 海水 包围 成 一 个 个 孤岛 ， 最 后 连珠 称 朗 玛 峰 也 将 被 淹没 在 海水 
ks 

这 场 人 类 认 知 章 命 的 意义 也 许 会 超过 印刷 术 的 及 明 ， 也 许 会 超过 
文字 的 有 发明， 甚至 只 有 人 类 产生 语言 可 与 之 相 比 。 请 系 好 安全 带 ， 欢 
迎 来 到 一 个 你 越 来 越 不 懂 的 世界 ! 


1. 我 在 斯 坦 福 大 学 的 博士 生 导 师 是 1959 年 麻 省 理工 学 院 的 博士 ， 从 我 的 导师 上 漳 到 
第 6 代 是 大 数学 家 高 斯 ， 到 第 11 代 就 是 莱 布 尼 茨 ， 这 么 算 ， 我 算 莱 老 的 第 12 代 “学 
孙 ” 。 


在 深入 探讨 机 器 如 何 学 习 瞳 知识 之 前 ， 我 们 先 要 知道 机 器 也 
能 够 自己 学 习 明 知识 和 默 知 识 。 在 这 一 章 我 们 介绍 机 器 学 习 的 五 
大 流派 的 底层 逻辑 和 各 自 不 同 的 先 验 模 型 。 虽 然 现在 神经 网 络 如 
日 中 天 ， 但 其 他 四 大 流派 也 不 容 忽视 。 


上 一 章 我 们 说 了 人 类 通过 感官 和 逻辑 能 掌握 明知 识 和 默 知 识 ， 但 
人 类 对 暗 知识 既 无 法 感受 也 无 法 理解 。 现 在 我 们 要 看 看 机 器 能 掌握 哪 
些 知 识 ， 并 撞 长 掌握 哪些 知识 。 


机 器 学 习 明 知识 


计算 机 科学 家 最 早 的 想法 是 把 自己 的 明知 识 ， 包 括 能 够 表达 出 来 
的 常识 和 经 验 放 到 一 个 巨大 的 数据 库 里 ， 再 把 常用 的 判断 规则 写成 计 
算 机 程序 。 这 就 是 在 20 世 纪 70 年 代 兴 起 并 在 20 世 纪 80 年 代 达 到 高 潮 的 
“知识 工程 ”和 “专家 系统 ”。 比 如 一 个 自动 驾驶 的 “专家 系统 ”就 


会 告诉 汽车 ，“ 如 采 红 灯亮 ， 就 停车 ， 如 果 转 这 时 遇 到 直行 ， 束 避 
让 ”， 依 徘 事 先 编 好 的 一 条 条 程序 完成 自动 区 驶 。 结 果 你 可 能 想到 
了 ， 人 们 无 法 穷尽 所 有 的 路 况 和 场景 ， 这 种 “专家 系统 ” 遇 到 复杂 情 
况 时 根本 不 会 处 理 ， 因 为 人 没 教 过 。“ 专 家 系统 ” 遇 到 的 另 一 个 问题 
是 假设 了 人 类 所 有 的 知识 都 是 明知 识 ， 完 全 没有 意识 到 默 知识 的 存 
在 。 一 个 典型 的 例子 是 20 世 纪 80 年 代 中 国 的 “中 医 专家 系统 ”。 当 时 
计算 机 专家 找到 一 些 知名 的 老 中 医 ， 通 过 访谈 记录 下 他 们 的 “ 望 闻 问 
切 ”方法 和 诊断 经 验 ， 然 后 编 成 程序 输入 到 计算 机 中 。 在 中 医 眼中 每 
一 个 病人 都 是 独特 的 。 当 他 看 到 一 个 病人 时 会 根据 经 验 做 出 一 个 整体 
的 综合 判断 。 这 些 经 验 连 老 中 医 自 己 都 说 不 清道 不 明 ， 是 典型 的 默 知 
识 。 所 以 中 医 诊断 绝 不 是 把 舌 侣 的 颜色 划分 成 几 种 ， 把 脉 象 分 成 几 十 
种 ， 然 后 用 碍 表 方 式 就 可 以 做 判断 的 。“ 专 家 系统 ” 既 不 能 给 机 器 输 
入 足够 的 明知 识 ， 更 无 法 把 默 知识 准确 地 表达 出 来 输入 给 机 器 。 所 
以 ，“ 专 家 系统 ”和 “知识 工程 ”在 20 世 纪 80 年 代 之 后 都 候 旗 奶 芯 
1 


要 想 把 一 个 领域 内 的 所 有 经 验 和 规则 全 部 写 出 来 不 仅 耗费 时 间 ， 
而 且 需 要 集合 许多 人 。 即 使 如 此 ， 那 些 谁 也 没有 经 历 过 的 情况 还 是 无 
法 窗 盖 。 电 脑 的 信息 处 理 速 度 比 人 脑 快 得 多 ， 那 么 能 不 能 把 大 量 的 各 
种 场景 下 产生 的 数据 提供 给 机 器 ， 让 机 器 自己 去 学 习 呢 ? 这 就 是 现在 
风行 一 时 的 “机 器 学 习 ”。 

今天 的 机 器 可 以 自己 学 习 两 大 类 明知 识 : 用 逻辑 表达 的 判断 规则 
和 用 概率 表达 的 事物 间 的 相关 性 。 


从 写 学 派 一 一 机 帮 目 己 摸索 出 决策 逻辑 


前 面 说 过 ， 理 性 主义 认为 事物 间 部 有 因果 关系 ， 基 于 因果 关系 ， 
通过 逻辑 论证 推理 就 能 得 到 新 知识 。 在 机 器 学 习 中 这 一 派 被 称 为 符号 
学 派 ， 因 为 他 们 认为 从 逻辑 关系 中 寻找 的 新 知识 都 可 以 归结 为 对 符号 


的 演算 和 操作 ， 就 像 几何 定理 的 推理 一 样 。 这 种 知识 通常 可 以 用 一 个 
远 辑 决 集 树 来 表示 。 决 集 树 是 一 个 根据 事物 属性 对 事物 分 类 的 树 形 结 
构 。 比 如 冬天 医院 门诊 入 满 为 患 ， 测 完 体 温 ， 主 任 医生 先 问 “哪里 不 
舒服 ”， 病 人 说 “头疼 ， 咳 嗽 ”， 主 任 医 生 再 听 呼 吸 。 感 冒 、 流 感 、 
肺炎 都 可 能 是 这 些 症状 的 原因 ， 现 在 要 根据 这 些 症状 判断 病人 到 懈 得 
了 什么 病 ， 这 种 从 结果 反 关 找 到 因果 链条 的 过 程 束 叫 “ 逆 疝 演绎 ”。 
这 时 候 主任 医生 用 的 就 是 一 个 决策 树 : 体温 低 于 38.5'C， 咳嗽 ， 头 
痛 ， 可 能 是 普通 感冒 ， 回 去 多 喝 白 开水 ! 体温 高 于 38.5'C， 还 剧烈 咳 
嗽 呼吸 困难 ， 可 能 是 肺炎 ， 咳 嗽 不 历 害 束 可 能 是 流感 。 实 际 情形 当然 
要 比 这 复杂 。 但 原理 就 是 根据 观察 的 症状 逐 项 排除 ， 通 过 分 类 找到 病 
因 。 


这 时 候 门 诊 新 来 了 实习 医生 小 丽 ， 要 在 最 短 时 间 内 学 会 主任 医生 
的 诊断 方法 。 主 任 医生 忙 得 根本 没 时 间 教 她 ， 就 扔 给 她 一 省 过 去 病人 
的 病历 和 诊断 结果 ， 自 己 琢磨 去 ! 小 丽 看 着 几 十 个 病人 的 各 项 指标 和 
诊断 结果 ， 不 知道 从 哪里 下 手 。 这 时 候 刚 学 了 决策 树 的 主治 医生 小 张 
路 过 说 : 我 来 帮 你 。 咱 先 随便 猜 一 个 主任 的 判断 逻辑 ， 比 如 先 看 是 否 
咳嗽 ， 再 看 是 否 发 烧 。 把 这 些 病例 用 这 个 逻辑 推演 一 遍 ， 如 果 逻 辑 的 
判断 结果 和 主任 的 诊断 结果 吻合 ， 咱 就 算 猜 中 了 。 如 果 不 吻合 ， 虽 就 
换个 逻辑 ， 无 非 是 换 些 判断 准则 ， 比 如 你 可 能 一 开始 把 体温 标准 定 在 
了 37.5C， 结 果 把 很 多 普通 感冒 给 判断 成 流感 了 。 当 你 用 39C 时 ， 又 
会 把 流感 判断 成 普通 感冒 。 几 次 试验 你 就 找到 了 38. 5C 这 个 最 好 的 
值 。 最 后 你 找到 的 逻辑 对 所 有 病例 的 判断 都 和 主任 医生 的 诊断 完全 吻 


人 
| 


所 以 决策 树 学 习 就 是 先 找到 一 个 决策 树 ， 它 对 已 知 数据 的 分 类 和 
己 知 结果 最 接近 。 好 的 分 类 模型 是 每 一 步 都 能 让 下 一 步 的 “混杂 度 ” 
最 小 。 在 实际 的 机 器 学 习 中 ， 决 策 树 不 是 猜 出 来 而 是 算出 来 的 。 通 过 
计算 和 比较 每 种 分 类 的 混杂 度 的 降低 程度 ， 找 到 每 一 步 都 最 大 限度 降 
低 混 杂 度 的 过 程 ， 就 是 这 个 决策 树 机 器 学 习 的 过 程 。 所 以 机 器 学 习 决 


朱 树 的 原理 是 : 根据 已 知 结果 可 以 反 推 出 事物 间 的 逻辑 关系 ， 再 用 这 
些 逻 辑 关 系 预测 新 的 结 

在 这 个 例子 里 的 “知识 ”就 是 医生 的 诊断 方法 ， 作 为 明知 识 被 清 
晰 表达 为 决策 多 辑 树 。 而 这 种 计算 和 比较 分 类 混杂 度 的 方法 就 是 让 机 
器 目 动 学 习 医 生 诊 断 知识 的 方法 。 


贝 叶 斯 学 派 一 一 机 器 从 结果 推出 原因 的 概率 


符号 学 派 认 为 有 因 必 有 果 ， 有 果 必 有 因 。 贝 叶 斯 学 派 问 ， 因 发 生 
果 一 定 发 生 吗 ? 感冒 是 发 烧 的 原因 之 一 ， 但 感冒 不 一 定 都 发 烧 。 贝 叶 
斯 学 派 承 认 因 果 ， 但 认为 因果 之 间 的 联系 是 不 确定 的 ， 只 是 一 个 概 
率 。 


我 们 的 经 验 中 比较 熟悉 的 是 当 一 个 原因 及 生 时 结果 出 现 的 概率 ， 
例如 你 感冒 后 会 发 伐 的 概率 ， 但 我 们 的 直觉 不 太 会 把 握 逆 概率 ， 即 知 
道 结 末 要 求 推出 原因 的 概率 ， 也 融 是 要 判断 发 伐 是 感冒 引起 的 概率 。 
贝 叶 斯 定理 就 是 教 我 们 怎么 算 这 样 的 概率 。 举 个 例子 ， 菜 人 去 医院 检 
查 身体 时 发 现 艾 滋 病 病毒 呈 阳 性 ， 现 在 告诉 你 一 个 艾滋 病人 检查 结 
呈 阳 性 的 概率 是 99%， 也 就 是 只 要 你 是 艾 洲 病人 ， 检 查 络 末 基 本 都 是 阳 
性 。 还 告诉 你 ， 人 群 中 艾滋 病 患 者 大 约 是 0. 3%， 但 所 有 人 中 碍 出 阳性 
的 人 有 2%。 现 在 问 得 艾滋 病 的 概率 多 大 ? 你 的 直觉 反应 可 能 是 ， 要 出 
大 事 了 ! 现在 我 们 看 看 贝 叶 斯 定理 怎么 说 。 贝 叶 斯 定理 如 下 : 

P《〈 得 艾滋 病 | 检查 呈 阳 性 ) =P《〈 得 艾滋 病 ) XP《 检 查 呈 阳性 | 得 
艾滋 病 ) /P《〈 检 查 呈 阳性 ) =99% 久 0. 3%/2%=14. 85%。 


也 就 是 说 即使 他 检查 呈 阳 性 ， 他 得 病 的 概率 也 不 到 15%! 这 个 结果 
非 第 违反 直觉 。 原 因 在 哪里 呢 ? 在 于 人 群 中 但 呈 阳 性 的 概率 远大 于 人 
群 中 得 艾滋 病 的 概率 。 这 主要 是 由 于 检测 手段 不 准确 ， 会 “冤枉 ”很 
多 好 人 。 所 以 以 后 不 管 谁 得 出 了 什么 病 呈 阳性 ， 你 要 问 的 第 一 件 事 是 


检查 呈 阳 性 和 得 病 的 比率 有 多 大 ， 这 个 比率 越 大 就 可 以 越 淡定 。 所 以 
贝 叶 斯 定理 告诉 我 们 的 基本 道理 是 : 一 个 结果 可 能 由 很 多 原因 造成 ， 
要 知道 一 个 结果 是 由 哪个 原因 造成 的 ， 一 定 要 先知 道 这 个 原因 在 所 有 
原因 中 的 占 比 。 

一 个 好 的 医生 知道 ， 要 判断 病人 是 否 感冒 ， 只 看 是 否 发 烧 这 一 个 
证 状 不 够 ， 还 要 看 是 否 有 咳嗽 、 嗓 子 痛 、 流 上 县 涕 、 头 痛 等 症状 。 也 惑 
是 我 们 要 知道 P〈 感 冒 发烧、 咳嗽 、 嗓 子 痛 、 流 鼻涕 、 头 痛 :…… 
幢 叶 斯 定理 告诉 我 们 计算 上 面 的 概率 可 以 通过 计算 P (发 烧 、 上 咳嗽 、 嗓 
子 痛 、 头 痛 ……| 感 冒 ) 获得。 为 了 简化 计算 ， 我 们 这 里 假设 发 烧 、 咳 
嗽 、 嗓 子 痛 、 头 痛 这 些 症 状 都 是 独立 的 ， 互 相 不 是 原因 《很 显然 这 个 
假设 不 完全 对 ， 很 可 能 嗓子 疼 是 咳嗽 引起 的 ) ， 这 样 P《〈 发 烧 、 咳 嗽 、 
嗓子 痛 、 头 痛 ……… | 感冒) =P (发 烧 | 感 冒 ) XP (咳嗽 | 感冒 ) XP 〈( 嗓 
子 痛 | 感 冒 ) XP (头痛 | 感冒 ) X…… 


这 里 每 一 个 概率 都 比较 容易 得 到 。 这 在 机 器 学 习 里 叫 作 “ 朴 素 贝 
叶 斯 分 类 器 ”。 这 个 分 类 器 广泛 应 用 于 垃圾 邮件 的 过 滤 。 我 们 知道 垃 
圾 邮件 往往 会 有 “人 免费、 中奖、 伟哥 、 发 财 ” 这 类 词汇 ， 这 类 词汇 就 
相当 于 感冒 会 出 现 的 症状 ， 世 圾 邮件 就 相当 于 感冒 。 过 滤 垃 圾 邮件 变 
成 了 判断 在 出 现 这 些 词汇 的 情况 下 这 封 邮 件 是 垃圾 邮件 的 概率 ， 也 就 
是 通过 统计 P《〈 出 现 “ 免 费 ”| 垃圾 邮件 ) ，P 出现“ 中 奖 ”| 垃 圾 邮 
件 ) 等 的 概率 ， 来 算出 P《〈 垃 圾 邮件 | 出 现 “免费 、 中 奖 、 伟 哥 、 发 
出 5 ) 的 概率 。 


同样 的 原理 还 被 广泛 应 用 在 语音 识别 上 。 一 个 单词 有 各 种 各 样 的 
发 音 ， 语 音 识别 束 是 听 到 一 个 发 音 判 断 是 茶 个 单词 的 概率 。 如 果 我 们 
把 “吃饭 ”这 个 词 的 天 南 地 北 男女 老少 的 发 音 都 收集 起 来 ， 统 计 出 
“吃饭 ”这 个 词 和 各 种 发 首 的 频次 ， 我 们 昕 到 一 个 发 首 “ 浴 碗 ”时 ， 
就 可 以 判断 是 否 在 说 “吃饭 ”。 为 什么 说 贝 叶 斯 朴素 分 类 此 是 机 器 学 
习 呢 ? 因为 它 是 通过 采集 大 量 数据 统计 出 每 个 单词 和 它们 分 别 对 应 的 


发 音 的 频率 来 判断 一 个 发 音 是 什么 单词 的 。 这 些 数据 越 多 ， 判 断 的 准 
确 性 就 越 局。 

在 这 个 例子 里 ，“ 知 识 ” 是 知道 当 一 个 结果 发 生 时 是 哪个 原因 造 
成 的 。 这 个 知识 被 清晰 地 表达 为 一 个 条 件 概 紊 。 机 器 通过 统计 每 种 原 
因 的 占 比 来 算出 从 结果 到 原因 的 概率 。 


类 推 学 派 一 一 机 器 学 习 默 知识 


我 们 生活 中 很 多 经 验 来 自 类 比 。 医 生 一 看 病人 的 面部 表情 和 走路 
姿势 就 基本 能 判断 出 是 普通 感冒 还 是 流感 ， 因 为 流感 症状 比 感冒 厉害 
得 多 。 科 学 上 的 许多 重要 发 现 也 是 通过 类 比 。 当 达尔 文 读 到 马尔 萨 斯 
( Malthus ， 1766 一 1834 ) 的 《人 口 论 》 ( Principle of 
Population) 时 ， 被 人 类 社会 和 上 自然 界 的 激烈 竞争 的 相似 性 所 触动 ; 
玻 尔 的 电子 轨道 模型 直接 借鉴 了 太阳 系 的 模型 。 机 器 学 习 中 用 类 比方 
法 的 这 一 派 叫 类 推 学 派 ， 他 们 的 逻辑 很 简单 : 第 一 ， 两 个 东西 的 某 些 
属性 相同 ， 它 俩 就 是 类 似 的 ; 第 二 ， 如 果 它 们 的 已 知 属性 相同 ， 那 么 
它们 的 未 知 属性 也 会 相同 。 开 好 车 上 班 的 人 可 能 也 会 用 苹果 手机 ， 喜 
欢 看 《星球 大 战 》 (Star WVars) 的 人 可 能 也 会 喜欢 看 《三 体 》 等 。 类 
比 的 逻辑 可 以 明确 表达 ， 但 具体 的 类 比 常 党 是 默 知识 。 例 如 老 警 察 一 
眼 就 能 看 出 谁 是 小 偷 ， 但 不 一 定 说 得 清楚 原因 。 

在 类 推 学 派 中 最 基础 的 算法 叫 最 近邻 法 。 最 近邻 法 的 第 一 次 应 用 
是 1894 年 伦敦 暴发 霍乱 ， 在 伦敦 的 某 些 城区 每 8 个 人 吏 会 死 1 个 ， 当 时 
的 理论 是 这 种 疾病 是 由 一 种 “不 民 气 体 ” 造 成 的 。 但 这 个 理论 对 控制 
疾病 没有 用 。 内 科 医 生 约 翰 。 斯 诡 把 伦敦 每 个 霍乱 病例 都 标 在 地 图 
上 ， 他 发 现 所 有 的 病例 都 靠近 一 个 公共 水 条 。 最 后 推 朵 病因 是 这 个 水 
泵 的 水 源 污染 ， 当 他 说 服 大 家 不 要 再 用 这 个 水 泵 的 水 后 ， 疾 病 就 得 到 


了 控制 。 在 这 里 这 些 数据 的 相似 点 就 是 和 这 个 水 条 的 距离 。 最 近邻 法 
还 有 一 个 应 用 就 是 在 网 上 搜 照 片 ， 你 对 局 铁 上 壬 座 的 人 很 愤慨 ， 你 把 
他 的 照片 上 传 ， 网 站 给 你 显示 出 儿 张 和 他 长 得 最 像 的 照片 ， 并 且 有 文 
字 ， 你 一 看 ， 天 哪 ， 还 是 个 在 读 博 士 生 ! 同样 的 道理 ， 很 多 智能 手机 
都 可 以 自动 进行 照片 分 类 ， 把 你 手机 里 的 人 像 都 自动 归 类 。 


在 类 推 学 派 中 ， 第 一 件 事 是 要 定义 “相似 度 ”。 相 似 度 可 以 是 丑 
高 、 收 入 等 连续 变量 ， 也 可 以 是 严 了 茶 一 类 书 的 次 数 的 统计 变量 ， 也 
可 以 是 性 别 这 样 的 离散 变量 。 总 之 ， 只 有 定义 了 相似 度 ， 才 能 度量 一 
个 分 类 方法 是 否 最 优 。 人 可 以 感受 相似 度 ， 但 无 论 是 人 的 感官 还 是 大 
脑 都 无 法 量化 相似 度 。 人 类 在 做 相似 度 比较 时 ， 甚 至 都 不 知道 目 己 在 
比较 哪些 特征 和 属性 ， 但 机 融 可 以 很 容易 量化 这 些 相似 度 。 所 以 只 要 
机 器 抓 准 了 特征 和 属性 ， 比 人 的 判断 还 准 。 

类 推算 法 可 以 用 于 跨 领 域 的 学 习 。 一 个 消费 品 公司 的 高 管 到 互联 
网 媒体 公司 不 需要 从 头 学 起 ， 华 尔 街 雇 用 很 多 物理 学 家 来 研究 交易 模 
型 ， 是 因为 这 些 不 同 领域 问题 的 内 在 数学 结构 是 类 似 的 。 类 推算 法 最 
重要 的 是 能 用 类 比 推导 出 新 知识 ， 就 像 我 们 前 面 提 到 的 达尔 文 受 《人 
口 论 》 的 局 发 。 

虽然 机 器 可 以 学 习 明 知识 和 默 知识 ， 但 它 最 大 的 本 事 是 学 习 暗 知 


从。 


机 器 发 现 瞳 知识 


暗 知 识 残 古 那 些 既 无 法 被 人 类 感受 义 不 能 表达 出 来 的 知识 。 也 就 
是 说 人 类 本 刁 无 法 理解 和 党 握 这 些 知 识 ， 但 机 器 却 可 以 。 机 器 有 两 种 
方法 可 以 掌握 这 些 知识 : 模仿 人 脑 和 模仿 演化 。 


联结 学 派 


联结 学 小 的 基本 思路 就 是 模仿 人 脑 神 经 元 的 工作 原理 : 人 类 对 所 
有 模式 的 识别 和 记忆 建立 在 神经 元 不 同 的 连接 组 合 方式 上 。 或 者 说 一 
个 模式 对 应 着 一 种 神经 元 的 连接 组 合 。 联 结 学 派 就 是 目前 最 火爆 的 神 
经 网 络 和 深度 学 习 ， 它 在 五 大 学 派 中 占 绝对 统治 地 位 。 目 前 人 工 智能 
的 高 科技 公司 中 绝 大 部 分 是 以 神经 网 络 为 主 。 第 三 章 我 们 专门 讨论 神 
经 网 络 。 


进化 学 铂 


机 器 学 习 中 一 共有 五 大 学 派 ， 最 后 一 个 学 派 是 进化 学 派 。 他 们 是 
激进 主义 经 验 派 ， 是 彻底 的 不 可 知 论 者 。 进 化 学 派 不 仅 觉得 因果 关系 
是 先 验 模型 ， 甚 至 觉得 类 比 ， 神 经 元 连接 也 都 是 先入 为 主 的 模型 。 他 
们 认为 不 管 选择 什么 样 的 先 验 模型 ， 都 是 在 上 第 面前 要 人 类 的 小 联 
明 ， 世 界 太 复 杂 ， 没 法 找到 模型 。 进 化 学 派 的 基本 思路 是 模仿 自然 界 
的 演化 : 随机 的 基因 变异 被 环境 选择 ， 适 者 生存 。 他 们 的 做 法 就 是 把 
-种 算法 表达 成 像 基 因 一 样 的 字符 串 ， 让 不 同 的 算法 基因 交配 ， 让 生 
出 来 的 儿女 算法 去 处 理 问题 ， 比 爸 妈 好 的 留 下 来 配种 继续 生 孙 子 ， 比 
和 爸 妈 差 的 就 淘汰 。 

比如 我 们 要 通过 进化 算法 找到 了 最 优 的 垃圾 邮件 过 滤 算 法 。 我 们 先 
假设 凡是 垃圾 邮件 都 包含 1 000 个 诸如 “人 免费”“ 中 奖 ”“ 不 转 不 是 中 
国信 ”这样 的 单词 或 句子 。 对 于 每 个 单词 我 们 可 以 对 邮件 施加 一 些 规 
则 ， 如 删除 或 者 怀疑 (“怀疑 ”是 进一步 看 有 没有 其 他 垃圾 词汇 ) 
等 。 如 果 规 则 就 这 两 种 ， 我 们 可 以 用 一 个 比特 表示 : 1 删除 ，0 怀 疑 。 
这 样 要 对 付 有 1 000 个 垃圾 词 的 算法 就 可 以 表示 成 1 000 比 特 的 一 个 字 
符 串 。 这 个 字符 串 束 相当 于 一 个 算法 的 基因 。 如 果 我 们 从 一 堆 随机 的 1 
000 比 特长 的 字符 串 开始 ， 测 量 每 个 字符 串 代表 的 算法 的 适应 度 ， 也 即 


它们 过 滤 垃 圾 邮件 的 有 效 性 。 把 那些 表现 最 好 的 字符 串 留 下 来 互相 
“交配 ”， 产 生 第 二 代 字 符 串 ， 继 续 测试 ， 如 此 循环 ， 直 到 一 代 和 下 
一 代 的 适应 度 没 有 进步 为 止 。 注 意 ， 这 里 和 生物 的 进化 有 个 本 质 区 
别 ， 就 是 所 有 的 算法 部 是 “长 生 不 老 ” 的 。 所 以 老 一 代 里 的 优秀 算法 
不 仅 可 以 和 同 代 的 算法 苋 争 ， 而 且 可 以 和 儿子 、 孙 子 、 子 子孙 孙 互 相 
苑 争 ， 最 后 的 胜利 者 不 一 定 都 是 同一 代 的 算法 。 

进化 算法 的 问题 是 “进化 ” 坚 无 方向 感 ， 完 全 是 频 芭 。 在 前 面 的 
垃圾 邮件 过 滤器 例子 里 ，1 000 比 特 的 字符 串 的 所 有 可 能 性 是 21000， 
也 即 10*?9， 即 使 用 目前 世界 最 快 的 超级 计算 机 ，“ 进 化 ”到 地 球 爆炸 
都 不 可 能 穷尽 所 有 可 能 ， 在 有 限时 间 内 能 探索 的 空间 只 是 所 有 可 能 空 
间 的 极 少 一 部 分 。 地 球 可 是 用 了 40 亿 年 时 间 才 进化 出 了 现在 所 有 的 生 
物 。 


图 2. 1 是 美国 华盛顿 大 学 佩 德 罗 。 多 明 臣 斯 (Pedro Domingos) 教 
授 总 结 的 一 张 五 大 流派 “八卦 图 ”。 


机 器 学 习 中 的 符号 学 派 、 贝 叶 斯 学 派 、 类 推 学 派 和 联结 学 派 的 共 
同 点 是 根据 一 些 已 经 发 生 的 事件 或 结果 ， 建 立 一 个 预测 模型 ， 反 复 调 
整 参 数 使 该 模型 可 以 拟 合 已 有 数据 ， 然 后 用 此 模型 预测 新 的 事件 。 不 
同 的 是 它们 各 上 自 背后 的 先 验 世界 模型 。 符 号 学 派 相 信和 事物 间 都 有 严密 
的 因果 关系 ， 可 以 用 逻辑 推导 出 来 ， 贝 叶 斯 学 派 认为 ， 因 发 生 ， 末 不 
一 定 发 生 ， 而 是 以 茶 个 概率 发 生 ， 类 推 学 派 认 为 ， 这 个 世界 也 许 根 本 
没有 原因 ， 我 们 只 能 观测 到 结果 的 相似 ， 如 果 一 只 乌 走 路 像 蝎 子 ， 叫 
起 来 像 蝎 子 ， 那 么 它 束 是 只 鸭子 ;联结 学 派 认 为 ， 相 似 只 是 相关 性 能 
外 Q 人 理解 的 那 层 表皮 ， 隐 藏 的 相关 性 深 偿 得 无 法 用 语言 和 风 辑 表达 ; 
最 后 进化 学 派 认 为 ， 什 么 因果 ? 什么 相关 ? 我 的 世界 模型 就 是 没有 模 
型 ! 从 零 开始 ， 不 断 试 错 ， 问 题 总 能 解决 ! 


符号 学 派 
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图 2.1 机 器 学 习 的 五 大 流派 


图 片 来 源 : 佩 德 罗 。 多 明 苹 斯 ，《 终 极 算法 》， 中 信 出 版 社 ，2017 年 。 
现在 我 们 终于 可 以 清理 一 下 满天飞 的 名 词 了。 我 们 在 媒体 上 最 常 
昕 到 的 是 这 四 个 名 词 : 人 工 乔 能 、 机 器 学 习 、 神 经 网 络 、 深 度 学 习 。 
这 四 个 词 的 关系 如 图 2. 2 所 示 ， 人 工 智 能 是 最 大 的 一 个 圆 ， 圆 里 面 分 为 
两 部 分 : 一 部 分 叫 人 工学 习 ， 也 就 是 前 面 我 们 讲 的 专家 系统 ， 另 一 部 
分 叫 机 器 学 习 ， 就 是 机 器 自己 学 习 。 机 器 学 习 里 面包 含 神 经 网 络 ， 在 
神经 网 络 里 面 还 要 再 分 ， 一 个 是 浅 度 学 习 ， 一 个 是 深度 学 习 。 在 过 去 
心 片 集成 度 低 时 ， 我 们 只 能 模仿 很 少 的 神经 元 。 现 在 由 于 集成 度 在 提 


高 ， 我 们 可 以 模仿 很 多 的 神经 元 ， 当 很 多 神经 元 被 组 成 多 层 的 网 络 
时 ， 我 们 就 叫 它 深度 学 习 。 所 以 人 工 智能 、 机 器 学 习 、 神 经 网 络 和 深 
度 学 习 的 关系 ， 其 实 就 像 一 个 洋葱 一 样 ， 一 层 包 训 一 层 ， 最 外 面 的 是 
人 工 智能 ， 往 里 一 点 是 机 器 学 习 ， 再 往 里 是 神经 网 络 ， 最 深层 就 是 深 
度 学 习 。 

所 以 这 四 个 词 有 下 面 的 包含 关系 ; 人 工 智能 > 机 器 学 习 > 神经 网 络 》 
深度 学 习 。 


机 售 学 : 习 


神经 网 络 


图 2.2 Al 中 四 个 概念 的 包含 关系 
今天 我 们 说 到 的 人 工 智 能， 其实 就 是 机 器 学 习 里 面 的 神经 网 络 和 


深度 学 习 。 但 是 在 一 般 的 商业 讨论 中 ， 这 四 个 概念 经 和 常 是 混 着 用 的 。 


和 A 一 二 


二 二 时 


神经 网 络 一 一 革 取 隐 散 相关 性 


导读 


个 流派 的 方法 后 ， 本 书 的 主角 “和 神经 网 
络 ” 现 在 闪 亮 登场 。 将 深入 介绍 神经 网 络 学 习 的 原理 和 在 商 


业 上 应 用 最 多 的 几 种 形态 ， 以 及 它们 的 适用 范围 。 有 了 这 些 基 
础 ， 我 们 才 可 以 真正 理解 AlphaGo Zero 是 怎样 发 现 神 迹 般 的 瞳 知 
识 的 。 对 于 只 起 了 解 AI 商业 前 景 的 读者 ， 也 可 以 先 跳 过 这 一 章 ， 
读 完 后 面 描述 机 器 学 习 神 奇 应 用 的 章节 后 再 回来 再 懂 它 是 如 何 工 
作 的 。 


从 感知 器 到 多 层 神 经 网 络 


1943 年 ， 心 理学 家 沃 伦 ， 麦 卡 洛克 (Warren McCulloch) 和 数理 
逻辑 学 家 沃尔特 。 皮 次 (Walter Pitts) 提出 并 给 出 了 人 工 神经 网 络 
的 概念 及 人 工 神经 元 的 数学 模型 ， 从 而 开 了 人 类 神经 网 络 研究 的 先 
河 。 世 界 上 第 一 个 人 工 神 经 元 叫 作 TLU (Threshold Linear Unit， 即 


国 值 逻辑 单元 或 线性 闪 值 单元 ) 。 最 初 的 模型 非常 简单 ， 只 有 几 个 输 
入 端 和 输出 端 ， 对 权 值 的 设置 和 对 国 值 的 调整 都 较为 简单 。 

1957 年 ， 一 个 开创 性 的 人 工 神经 网 络 在 康 系 尔 航空 实验 室 诞 生 
了 ， 它 的 名 字 叫 作 感 知 器 (Perceptron) ， 由 弗兰克 。 罗 森 布 莱特 
(Frank Rosenblatt ) 提出 ， 这 也 是 首次 用 电子 线路 来 模仿 神经 元 。 
他 的 想法 很 简单 ， 如 图 3. 1 所 示 : 将 其 他 电子 神经 元 的 几 个 输入 按照 相 
应 的 权重 加 在 一 起 ， 如 果 它 们 的 和 大 于 一 个 事先 给 定 的 值 ， 输 出 就 打 
开 ， 让 电流 通 回 下 一 个 神经 元 ;如 果 小 于 这 个 事先 给 定 的 值 ， 输 出 就 
关闭 ， 没 有 电流 流向 下 一 个 神经 元 。 

1960 年 ， 斯 坦 福 大 学 教授 伯 纳 德 。 威 德 罗 〈Bernard Widrow) 和 
他 的 第 一 个 博士 生 马 尔 西安 。 泰 德 。 霍 夫 (Marcian Ted Hoff) 提出 
了 自 适 应 线性 神经 元 (ADaptive LInear NEurons，ADLINE) 。 他 们 第 
一 次 提出 了 一 种 可 以 自动 更 新 神经 元 系数 的 方法 (机 器 自我 学 习 的 原 
始 起 点 ) : 用 输出 误差 的 最 小 均 方 去 自动 从 代 更 新 神经 元 权重 系数 ， 
直至 输出 信号 和 目标 值 的 误差 达到 最 小 。 这 样 就 实现 了 权重 系数 可 以 
自动 连续 调节 的 神经 元 。 目 适应 线性 神经 元 最 重要 的 贡献 是 第 一 个 使 
用 输出 信号 和 目标 值 的 误差 上 自动 反馈 来 调整 权 值 ， 这 也 为 后 面神经 网 
络 发 展 历史 上 里 程 碑 式 的 反 辐 传播 算法 奠定 了 基础 。 
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图 3.1 感 知 器 的 电子 线路 


这 个 单 层 的 神经 网 络 也 被 称 为 目 适 应 信号 处 理 器 ， 被 广泛 应 用 在 
通信 和 雷达 当中 。 霍 夫 后 来 加 入 英特尔 ， 在 1971 年 设计 了 世界 上 第 一 


个 微 处 理 器 Intel 4004。 威 德 罗 教授 也 是 笔者 20 世 纪 80 年 代 后 期 在 斯 
坦 福 大 学 的 博士 生 导 师 。 笔 者 曾经 在 他 的 指导 下 做 过 神经 网 络 的 研究 
工作 。 图 3. 2 是 笔者 2016 年 和 他 讨论 神经 网 络 未 来 发 展 时 的 合影 ， 笔 者 
手中 拿 的 那个 黑 盒子 就 是 他 1960 年 做 出 的 ADLINE 单 层 神经 网 络 。 这 个 
盒子 到 今天 还 在 工作 ， 美 国 国家 博物 馆 兽 经 想 要 这 个 盒子 做 展品 ， 但 
威 德 罗 教 授 回 答 说 “我 还 要 用 它 来 教学 ”。 
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图 3.2 笔 者 和 自己 当年 斯 坦 福 大 学 的 博士 导师 ， 神 经 网 络 鼻祖 之 一 威 德 罗 教授 的 合影 


威 德 罗 教授 在 1962 年 还 提出 过 一 个 三 层 的 神经 网 络 (Multi-Layer 
Adaptive Linear Neurons，MADALINE) ， 但 没有 找到 一 个 能 够 用 于 任 
意 多 层 网 络 的 、 简 洁 的 更 新 权重 系数 的 方法 。 由 于 单 层 网 络 有 广泛 应 
用 而 多 层 网 络 的 运算 速度 太 慢 (当时 的 电脑 运算 速度 是 今天 的 100 亿 分 
之 一 ) ， 所 以 在 MADALINE 之 后 没有 人 去 继续 深入 探讨 多 层 网 络 。 


由 于 缺少 对 人 脑 工作 模式 的 了 解 ， 神 经 网 络 的 进展 一 度 较 为 组 
慢 ， 而 它 进 入 快速 发 展期 的 一 个 触发 点 则 是 医学 领域 的 一 个 发 现 。 
1981 年 ， 详 贝尔 生理 学 或 医学 奖 颁 发 给 了 美国 神经 生物 学 家 大 卫 。 衣 
贝尔 (David Hubel) 、 托 尔 斯 腾 。 威 去 尔 〈Torsten Wiesel) 和 罗 杰 
“斯 修 里 〈Roger Sperry) 。 前 两 位 的 主要 页 献 是 发 现 了 人 类 视觉 系 
统 的 信息 处 理 采 用 分 级 方式 ， 即 在 人 类 的 大 脑 皮 质 上 有 多 个 视觉 功能 
区 域 ， 从 低级 至 高 级 分 别 标 定 为 Vi1 V5 等 区 域 ， 低 级 区 域 的 输出 作为 高 
级 区 域 的 输入 。 人 类 的 视觉 系统 从 视网膜 〈Retina) 出 发 ， 经 过 低级 
的 V1 区 提取 边缘 特征 ， 到 V2 区 的 基本 形状 或 目标 的 局 部 ， 再 到 高 层 V4 
的 整个 目标 (例如 判定 为 一 张 人 脸 ， ， 以 及 到 更 高 层 进行 分 类 判断 
等 。 也 就 是 说 高 层 的 特征 是 低层 特征 的 组 合 ， 从 低层 到 高 层 的 特征 表 
达 越 来 越 抽 象 和 概念 化 。 至 此 ， 人 们 了 解 到 大 脑 是 一 个 多 层 深度 架 
构 ， 其 认 知 过 程 也 是 连续 的 。 


神经 网 络 学 习 的 本 质 是 大 量 神经 元 通过 复杂 的 连接 形成 记忆 。 
为 分 析 简 单 且 容易 用 电子 元 件 实现 ， 一 开始 人 工 神经 网 络 就 如 图 3. 3 那 
样 由 一 层 一 层 组 成 。 其 实 人 脑 的 神经 元 连接 非常 复 林 ， 没 有 这 么 一 层 
一 层 的 清晰 和 有 秩序 。 但 我 们 目前 并 没有 和 弄 消 楚 人 脑 神经 元 的 连接 方 
式 ， 先 从 简单 的 假设 入 手 是 科学 的 一 般 方法 。 


输入 层 隐 层 输出 层 


图 3.3 一 个 多 层 神经 网 络 (其 中 每 个 方块 代表 一 个 神经 元 ) 


20 世 纪 80 年 代 ， 神 经 网 络 的 另 一 个 重大 突破 是 当时 在 加 利 福 尼 亚 
州 大 学 圣 友 蕊 校 区 任教 的 美国 心理 学 家 大 卫 。 重 梅 哈 特 〈(David 
Rumelhart ) 和 在 卡 内 基 梅 隆 大 学 任教 的 计算 科学 家 杰 弗 里 。 辛 顿 

(Jeffrey Hinton) 提出 的 多 层 神 经 网 络 ， 以 及 一 个 普通 的 自动 更 新 

权重 系数 的 方法 。 前 面 说 过 ， 威 德 罗 教授 在 1962 年 提出 过 一 个 三 层 的 
神经 网 络 ， 但 功 亏 一 筑 ， 没 有 找到 一 个 简洁 的 任意 多 层 网 络 权 重 系 数 
的 更 新 方法 。 这 个 问题 在 1986 年 被 鲁 梅 哈 特 和 辛 顿 解 决 了 。 他 们 借鉴 
了 单 层 神经 网 络 中 威 德 罗 - 霍 夫 (Widrow-Hoff〉 反 馈 算法 的 思路 ， 同 
样 用 输出 误差 的 均 方 值 一 层 一 层 递 进 地 反馈 到 各 层 神 经 网 络 去 更 新 系 
数 。 这 个 算法 就 是 今天 几乎 所 有 神经 网 络 都 在 用 的 “ 反 回 传播 ” 算 
法 。“ 反 同 传 播 ” 听 上 去 很 “高 大 上 ”， 实 际 上 就 是 在 自动 控制 和 系 
统 理论 里 面 多 年 一 直 在 用 的 “反馈 ”， 只 不 过 在 多 层 网 络 中 反馈 是 一 
层 一 层 递 进 的 。 因 为 一 个 多 层 的 神经 网 络 要 通过 成 二 上 万 次 “用 输出 
误差 反馈 调整 系数 ”， 所 以 运算 量 非常 大 。 在 20 世 纪 80 年 代 的 计算 能 
力 限 制 下 ， 神 经 网 络 的 规模 非常 小 (例如 三 层 ， 每 层 几 十 个 神经 
元 ) 。 这 种 小 规模 的 神经 网 络 虽 然 显 示 了 神奇 的 能 力 〈 例 如 能 够 识别 
0 9 一 共 10 个 手写 体 数 字 ) ， 但 仍然 无 法 找到 真正 的 商用 。 


从 第 一 个 电子 神经 元 感知 器 的 发 明 (1957 年 ) 到 神经 网 络 的 大 规 
模 应 用 (2012 年 ) 整整 经 历 了 55 年 的 艰辛 探索 ， 许 多 天 才 科 学 家 不 顾 
喇 骸 和 失败 ， 坚 信 这 条 路 是 对 的 。 图 3. 4 是 在 这 个 探索 旅程 中 做 出 重大 
贡献 的 科学 家 。 


深度 神经 网 络 
向 量 支持 机 “ 《提前 训练 ) 


自 适应 线 多 层 感 知 器 
性 神经 元 “或 非 感知 器 ( 反 向 传播 ) 


1950 1960 1970 1980 1990 2000 


图 3.4 1940 一 2010 年 基于 神经 网 络 的 Al 发 展 史 上 做 出 突破 性 贡献 的 科学 家 


图 片 来 源 : 
https://beamandrew. github. io/deeplearning/2017/02/23/deep_learning 101_pa 
rt1. htm| 。 


神经 网 络 模型 : 满 是 旋钮 的 黑 盒 


在 这 一 节 中 ， 我 们 用 最 简单 的 方法 介绍 机 需 学 习 的 机 理 。 像 图 3. 3 
这 样 一 个 多 层 神经 网 络 的 左 问 是 输入 端 ， 即 要 识别 的 信息 从 这 里 输 
入 。 例 如 要 识别 一 幅 图 像 ， 每 个 输入 Xi 就 是 这 张 图 像 的 一 个 像素 的 灰 
度 值 (为 了 简单 起 见 我 们 假设 图 像 是 黑白 的 ， 如 果 是 彩色 的 ， 我 们 可 
以 想象 三 个 这 样 的 网 络 重 登 起 来 用 ) 。 从 输入 层 的 每 个 神经 元 到 下 一 
层 的 每 个 神经 元 都 有 一 个 连接 ， 从 输入 层 的 第 7 个 神经 元 到 下 一 层 第 .7 
个 神经 元 的 连接 有 一 个 乘法 因 了 于 Wij。 每 一 层 到 下 一 层 都 类 似 。 在 输出 
端 ， 每 根 线 对 应 一 个 识别 出 来 的 物体 。 我 们 可 以 把 每 个 输出 想象 成 一 
个 灯泡 。 当 机 器 友 现 输入 是 条 个 物体 时 ， 对 应 该 物体 的 灯泡 束 在 所 有 
输出 灯泡 里 最 腕 


像 这 样 一 个 多 层次 的 神经 网 络 是 如 何 “ 学 习 ” 的 呢 ? 我 们 可 以 把 
这 个 多 层 网 络 看 成 一 个 黑 盒子 。 盒 子 外 面 有 许多 可 以 调节 的 旋钮 ， 如 
图 3. 5 所 示 。 


有 许多 旋钮 的 黑 盒子 


车 =+1 

猫 =+2 

一 一 机 器 上 有 许多 可 调 旋 钮 ( 神经 元 之 间 连 接 的 权 系数 ) 

一 一 对 应 每 类 输入 ， 输 出 有 一 个 灯泡 ( 即 给 每 类 数据 赋 一 个 输出 目标 值 ， 
如 车 =+1， 猫 =+2) 

一 一 把 一 类 数据 喂 给 机 器 ， 调 旋钮 直到 只 有 对 应 这 类 数据 的 灯泡 亮 (输出 
达到 目标 值 ) 

一 一 循环 喂 数 据 、 调 旋钮 ， 直 到 对 所 有 类 型 的 输入 都 达到 输出 目标 值 


图 3.5 机 器 学 习 : 调节 黑 盒子 外 的 旋钮 


我 们 的 第 一 个 任务 是 训练 这 个 黑 盒 子 能 够 识别 图 像 中 的 物体 。 例 
如 在 图 3. 5 中 ， 输 入 端 有 两 张 图 ， 一 张 汽车 图 片 和 一 张 猫 的 图 片 。 我 们 
训练 的 目的 是 只 要 输入 各 种 汽车 的 图 片 ， 机 器 就 能 告诉 我 们 “这 张 图 
征 汽 车 ”《〈 对 应 “汽车 ”这 个 物体 的 输出 端 的 灯泡 最 冠 ) 。 同 样 ， 只 
要 我 们 输入 猫 的 图 片 ， 机 口 就 告诉 我 们 “这 张 图 是 猫 ”《〈 对 应 “ 猫 ” 
的 灯泡 最 壳 ) 。 训 练 的 过 程 是 这 样 的 :我们 先 指定 输出 的 一 个 灯泡 最 
亮 对 应 于 识别 出 了 汽车 ， 第 二 个 灯泡 最 亮 对 应 猫 ， 等 等 。 我 们 移 找 到 
足够 多 的 汽车 图 片 〈 例 如 1 万 张 ， 训 练 图 片 越 多 ， 训 练 出 的 机 器 判断 越 
准确 ) ， 一 张 一 张 给 机 器 “看 ”《 实 际 训练 是 一 组 一 组 地 给 机 器 
看 ) 。 在 机 器 没有 训练 好 时 ， 当 我 们 输入 一 张 汽 车 图 片 时 ， 和 输出 的 灯 


泡 会 乱 亮 。 我 们 此 时 耐心 地 调节 那些 旋钮 直到 只 有 对 应 “汽车 ”的 灯 
泡 亮 为 止 。 然 后 我 们 输入 下 一 张 汽车 图 片 ， 也 调 到 只 有 对 应 汽车 的 灯 
泡 亮 为 止 ， 如 此 一 直到 1 万 张 。 然 后 我 们 再 输入 第 一 张 猎 的 图 片 ， 调 节 
旋钮 直到 对 应 “ 猫 ” 的 灯泡 亮 为 止 ， 也 如 此 一 直到 1 万 张 猫 的 图 片 都 输 
入 完 为 止 。 如 果 我 们 让 机 器 学 习 1 000 种 物体 的 图 片 ， 那 我 们 对 每 种 物 
体 图 片 都 要 如 此 操作 ， 让 输出 端 对 应 这 种 物体 的 灯泡 最 亮 。 所 以 在 机 
器 学 习 中 ，“ 训 练 ” 是 最 耗 时 的 。 在 训练 过 程 中 ， 这 些 训练 用 的 图 片 
我 们 事先 知道 是 什么 内 容 ， 或 者 叫 作 “标注 ”过 的 图 片 。 当 训练 结 
后 ， 第 二 步 是 测试 。 也 就 是 拿 一 些 不 在 训练 集 里 面 的 图 片 让 机 器 辨 
认 ， 如 果 机 器 都 能 辨认 出 来 ， 这 部 机 器 就 算 训练 好 了 ， 可 以 交付 使 用 
了 。 一旦 训练 测试 结束 ， 机 器 的 参数 集 就 不 改变 了 ， 也 就 是 所 有 的 旋 
钮 都 固定 不 动 了 。 只 要 是 输入 训练 过 的 种 类 ， 机 器 都 应 该 能 识别 出 
> 

如 果 一 部 机 器 要 识别 1 000 种 物体 的 图 片 ， 就 要 至 少 有 1 000 个 输 
出 端 〈 每 个 输出 端 对 应 一 种 物体 ) 。 假 设 图 片 分 辨 率 是 100X100=10 
000 像 素 〈 很 低 的 分 辨 率 ) ， 如 果 这 部 机 器 只 有 三 层 神经 网 络 〈 深 度 最 
浅 的 “深度 ”学 习 网 络 ) ， 输 入 端 和 中 间 层 之 间 ， 中 间 层 和 输出 之 间 
的 连接 就 有 10 000X10 000+10 000X1 000=1.1 亿 个 。 也 就 是 这 部 机 
器 有 1 亿 多 个 旋钮 。 堆 至 2017 年 ， 最 大 的 神经 网 络 已 经 号 称 有 上 万 亿 的 
参数 ， 即 上 万 亿 个 旋钮 。 这 么 多 旋钮 显然 无 法 用 人 工 去 调节 。 


筋 里 下 山 : 训练 机 器 模型 


幸运 的 是 数学 上 200 年 前 就 有 了 “自动 ”调节 旋钮 的 办 法 。 这 个 办 
法 叫 作 “最 陡 梯 度 法 ”， 或 者 通俗 地 叫 作 “和 雾 里 下 山 法 ”。 当 我 们 训 
练 一 个 机 器 学 习 柑 型 时 ， 我 们 事先 知道 每 一 张 图 片 是 什么 物体 ( 汽 


车 、 猫 等 已 经 标注 的 图 片 ) ， 我 们 输入 汽车 图 片 时 ， 要 求 只 有 对 应 
“汽车 ”的 那个 灯泡 最 完 。 在 我 们 调节 旋钮 之 前 ， 灯 泡 的 亮 和 灭 都 是 
混乱 的 ， 和 我 们 的 要 求 有 很 大 误差 。 这 些 误差 是 由 旋钮 的 值 决定 的 。 
如 果 把 这 些 误差 夯 成 一 幅 图 像 ， 就 像 图 3. 6 一 样 有 很 多 山峰 ， 误 差 就 是 
山峰 的 高 度 ， 图 像 的 模 轴 和 纵 轴 就 是 旋钮 的 值 。 


J(0,,0,) 


图 3.6 用 “最 陡 梯 度 法 ”寻找 误差 最 小 的 “山谷 ” 
图 片 来 源 : 维基 百科 。 
当 我 们 输入 第 一 张 图 片 时 ， 我 们 可 能 站 在 一 个 随机 的 位 置 ， 例 如 


某 一 座 山 峰 的 山顶 或 羊 山腰， 我 们 的 任务 就 是 走 到 最 低 的 一 个 谷 帮 
(误差 最 小 ) 。 我 们 此 时 相当 于 在 大 雾 中 被 困 在 山里 只 能 看 见 眼前 的 
山坡 ， 一 个 最 笨 的 办 法 就 是 “最 陡 下 降 法 ”: 站 在 原 地 转 一 圈 ， 找 到 
一 个 最 陡 的 下 山 方 癌 往 这 个 方 同 走 一 步 。 在 这 个 新 的 位 置 上 ， 再 转 一 
圈 找 到 最 陡 的 下 山 方 同 再 走 一 步 ， 如 此 循环 ， 一 直 走 到 山脚 为 止 。 

在 “最 陡 下 降 法 ”中 每 次 转圈 找 最 陡 下 山 方向 相当 于 用 误差 函数 
的 偏 微 分 方程 求 梯度 。 简 单 地 讲 ， 旋 钮 的 每 一 步 的 调节 值 是 可 以 算出 
来 的 。 这 样 我 们 根据 输出 的 误差 一 步 一 步 地 算出 旋钮 的 调节 值 ， 直 到 
满意 为 止 。 这 种 根据 误差 回头 调 市 旋钮 的 方法 也 叫 “ 反 癌 传 播 算 


法 ”， 意 思 是 用 输出 误差 一 层 一 层 地 从 输出 问 同 输入 端 把 各 层 的 权重 


AlphaGo 的 “上 和 项 视角 ?” 


有 了 上 面 的 基础 ， 我 们 现在 就 可 以 理解 为 什么 AL1phaGo 这 么 厉害 。 
围棋 棋盘 有 19X19=361 个 交叉 点 ， 每 个 交叉 点 可 以 二 选 一 : 白 子 或 黑 
子 。 这 样 所 有 的 摆 法 就 是 2301， 或 者 10188。 人 类 2 000 年 来 一 共 保 留 下 
来 的 围棋 残局 中 盘 大 约 3 000 万 个 。 人 类 下 过 的 棋局 相当 于 大 海里 的 一 
滴水 《即使 剔除 那些 明显 没有 意义 的 摆 法 ) 。 一 位 棋 手 即使 每 天 下 2 盘 
棋 ，50 年 内 天 天 下 ， 一 生 也 只 能 下 36 500 盘 棋 。 图 3. 7 是 一 张 “ 雾 里 下 
山 ” 的 示意 图 。 下 棋 的 终极 目标 相当 于 在 群 山中 找到 最 低 的 谷底 (对 
应 于 最 理想 的 走 法 ) 。 如 果 所 有 可 能 的 走 法 是 绵延 几 和 干 里 的 群 山 ， 人 
类 棋 手 2 000 年 来 就 相当 于 一 直 在 同一 个 小 山 坊 里 面 打转 转 。 第 一 位 棋 
手 偶 然 的 棋 路 会 影响 他 的 徒弟 ， 以 后 的 徒 子 徒 孙 都 始终 在 这 个 小 山 均 
附近 徘徊 。 而 机 器 学 习 像 个 “ 神 行 太保 ”， 以 比 人 快 百 万 倍 的 速度 迅 
速 扫 遍 群 山 ， 很 快 就 能 找到 一 个 远离 人 类 徘徊 了 2 000 年 的 更 低 的 山谷 
(可 能 还 不 是 绝对 最 低 ， 但 比 人 类 徘徊 处 低 ) 。 这 也 是 连 棋 圣 胎 卫 平 
都 连 呼 “看 不 懂 ”AlphaGo 棋 路 的 原因 。〈( 见 图 3.7) 


人 类 2 000 年 来 徘徊 处 


下 ODODE % 


图 3.7 机 器 学 习 可 以 迅速 扫 过 群 山 找到 最 低 处 


这 个 原理 可 以 用 于 解决 许多 类 似 的 问题 。 这 类 问题 的 特点 是 变量 
非常 多 ， 可 能 解 是 天 文 数字 ， 例 如 经 济 和 社会 决策 、 军 事 行 动 策划 


ay 
等 。 


局 部 最 优 : 没 到 山 帮 怎 么 办 


“ 雾 里 下 山 法 ”会 遇 到 一 个 问题 ， 就 是 会 走 进 一 个 不 是 最 低 的 谷 
底 而 且 再 也 走 不 出 来 了 。 用 一 维 函 数 能 清楚 地 看 到 这 个 问题 。 图 3. 8 是 
有 两 个 “谷底 ”: A 点 和 B 点 的 一 维 函 数 。 当 下 山 走 到 A 点 时 ， 只 要 每 次 


的 步伐 不 是 特别 大 ， 不 论 往 左 还 是 往 右 再 移动 ， 总 是 会 回 到 A 点 。 这 在 
数学 上 叫 “ 局 部 最 小 值 ”， 而 B 点 才 是 “全 局 最 小 值 ”。 


起 始点 


局 部 最 小 值 
A 


全 局 最 小 值 
B 
图 3.8 有 两 个 谷底 的 一 维 函数 


但 是 如 果 我 们 从 一 维 扩展 到 二 维 ， 就 有 可 能 从 一 个 “局 部 最 小 
值 ” 中 逃逸 。 在 图 3. 9 中 ， 假 设 函 数 1 是 一 个 沿 X 轴 切 下 去 的 一 维 函数 ， 
A 点 就 是 函数 1 的 一 个 “局 部 最 小 值 ”。 如 果 一 个 小 珠子 只 能 沿 着 X 轴 深 
动 ， 就 会 陷 在 A 点 出 不 来 。 但 在 图 中 的 二 维 曲 面 上 ， 小 珠子 只 要 沿 着 Y 
轴 方 同 挪 动 一 点 ， 束 到 了 C 点 ， 而 从 这 个 C 点 出 及 就 能 到 达 整 个 曲面 的 
“全 局 最 小 值 ”B 点 。 当 误 兰 函数 的 维 数 增加 时 ， 这 种 从 “局 部 最 小 
值 ”逃逸 的 机 会 就 会 增 大 。 我 们 无 法 画 出 三 维 以 上 的 图 像 ， 但 我 们 可 
以 想象 每 个 “局 部 最 小 值 ”附近 都 有 许多 “ 虫 洞 ”可 以 方便 逃逸 。 维 
数 越 高 ， 这 种 虫 调 融 越 密集 ， 就 越 不 容易 陷 在 一 个 “局 部 最 小 值 ” 
里 


图 3.9 从 一 维 空间 扩展 到 二 维 空间 ， 误 差 函 数 找到 “全 局 最 小 值 ”的 概率 增 大 
如 果 图 3. 9 不 够 直观 ， 我 们 可 以 用 一 个 数字 阵列 来 表达 。 首 先 假设 


地 形 是 一 个 一 维 函 数 ， 每 个 数字 表示 它 的 海拔 高 度 。 在 图 3. 10 中 ， 有 
两 个 最 小 的 海拔 高 度 0/ 和 5， 但 是 无 论 从 哪 一 边 开始 下 山 ， 每 走 一 步 的 
话 ， 都 会 被 困 在 高 度 5 这 个 “局 部 最 小 值 ”里 出 不 来 ， 无 法 走 到 “绝对 
最 小 值 ”0。 


| 二 | 


图 3.10 地 形 永 数 的 数字 阵列 


但 是 ， 如 果 将 这 个 地 形 夺 加 为 二 维 函 数 ， 仍 然 用 数字 表示 海拔 高 
度 ， 我 们 可 以 看 到 ， 无 论 从 哪 一 边 开 始 下 山 ， 每 走 一 步 ， 当 在 一 维 函 
数 中 走 到 “局 部 最 小 值 ”5 以 后 ， 在 另外 一 个 维度 的 函数 中 ， 则 可 以 继 
续 走 到 更 低 的 海拔 ， 直 到 到 达 “ 全 局 最 小 值 ”0。 同 样 地 ， 维 度 越 多 ， 
在 茶 一 个 维度 到 达 “ 局 部 最 小 值 ”后 ， 可 以 选择 的 其 他 维度 和 路 径 就 
越 多 ， 因 此 被 困 在 “局 部 最 小 值 ”的 概率 就 越 低 。《〈 见 图 3. 11) 


图 3.11 将 地 形 赤 加 为 二 维 函 数 


深度 学 习 一 一 化 繁 为 简 


为 什么 深度 学 习 有 许多 层 神 经 元 ?这 是 因为 世界 上 许多 信息 和 知 
识 是 可 以 通过 分 层 表 达 的 。 例 如 人 脸 是 很 复杂 的 一 幅 图 像 ， 但 人 脸 可 
以 先 分 解 成 五 官 ， 五 官 的 复杂 程度 就 比 人 脸 低 了 ， 五 官 又 可 以 进一步 
分 解 为 线条 。 深 度 学 习 就 是 用 一 层 神经 元 去 识别 一 个 层级 的 信息 。 在 
图 3. 12 中 ， 左 图 是 第 一 层 网 络 来 识别 人 脸 上 的 线条 ， 中 间 的 图 是 第 二 
层 网 络 在 识别 出 线条 的 基础 上 识别 出 器 官 ， 右 图 是 第 三 层 网 络 在 识别 
出 器 官 的 基础 上 识别 出 长 相 。 同 样 一 个 时 间 序 列 的 信息 ， 例 如 语音 
可 以 分 解 为 递 进 的 层级 : 句子 、 单 词 、 音 节 等 。 分 层 的 最 大 好 处 是 大 
大 降低 计算 量 ， 把 原来 的 N 次 计算 变 为 mnX logN 次 计算 ， 这 里 m 是 层 数 。 

除了 将 要 处 理 的 信息 表达 为 层级 以 外 ， 另 外 一 种 降低 计算 量 的 方 
法 是 将 “一 大 块 ” 信 息 分 解 为 许多 小 块 来 处 理 。 例 如 想 要 在 一 张 像素 
很 大 的 图 片 中 识别 出 一 个 小 三 角形 ， 我 们 只 需 拿 着 这 个 小 三 角形 的 模 
板 在 大 图 中 滑动 比较 即 可 。 例 如 一 张 图 的 像素 是 1 000X1 000=1 000 
000， 如 果 拿 一 个 1 000X1 000 像 素 的 模板 去 比较 ， 计 算 量 大 约 是 1 


000 000X1 000 000 。 如 果 这 个 三 角形 的 大 小 是 10X10， 我 们 用 
10X10“ 模 板 滑动 法 ”， 计 算 量 只 要 10X10X1 000 000， 是 原来 的 万 
DA 
分 之 一 。 


图 3.12 深 度 学 习 神 经 网 络 学 习 得 到 的 不 同 层次 的 特征 
图 片 来 源 : 维基 百科 。 
机 器 要 处 理 的 信息 有 些 是 空间 信息 ， 例 如 图 片 ， 有 些 是 时 间 信 
轧 ， 例 如 语音 。 针 对 不 同 的 信息 ， 神 经 网 络 的 结构 不 同 。 最 常见 的 有 
两 种 ， 第 一 种 是 处 理 空间 信息 的 卷 积 神经 网 络 (Convolutional 
Neural Network，CNN) ， 第 二 种 是 处 理 时 间 信 息 的 循环 神经 网 络 
(Recurrent Neural Network，RNN) 。 下 面 我 们 一 一 介绍 。 


化 整 为 零 的 郑 积 神经 网 络 


“ 卷 积 ”这 个 词 什么 意思 待 会 咀 们 再 讲 ， 但 现在 可 以 告诉 你 的 
征 ， 目 前 人 工 乔 能 和 机 器 学 习 制造 的 奇迹 ， 从 下 围棋 到 目 动 驾驶 再 到 
人 脸 识别 ， 背 后 全 是 卷 积 神经 网 络 。 能 知道 卷 积 神经 网 络 的 工作 原 
理 ， 你 就 和 周围 大 部 分 读 了 几 本 人 工 智 能 的 书 的 人 不 是 一 个 档次 了 。 
里 然 大 部 分 人 不 会 从 事 人 工 智能 的 专业 工作 ,但 卷 积 神经 网 络 解决 问 
题 的 思路 会 让 我 们 担 案 叫绝 。 第 一 个 提出 卷 积 神经 网 络 的 是 前 面 说 的 
神经 网 络 教 父 杰 弗 里 。 注 顿 教授 的 博士 后 学 生 ， 一 位 叫 岩 拉 孔 〈Yan 


LeCun ) 的 法 国人 ， 现 在 任 Facebook 〈 脸 书 ) 人 工 智 能 研究 所 主任 ， 和 
对 顿 同 为 神经 网 络 四 大 天 王 之 一 。 


降低 运算 量 束 是 降低 成 本 


神经 网 络 每 一 层 的 每 一 个 神经 元 都 和 后 面 一 层 的 每 一 个 神经 元 相 
连接 。 如 果 第 一 层 有 1 万 个 神经 元 ， 第 二 层 也 有 1 万 个 ， 这 两 层 之 间 的 
连接 就 有 1 亿 个 。 如 果 像 微软 那个 一 举 超过 人 脸 识 别 图 像 能 力 的 
ResNet (深度 残 差 网 络 ) 有 152 层 ， 这 些 连接 就 有 151 亿 个 。 也 就 是 说 
我 们 要 调整 的 黑 盒子 上 有 151 亿 个 旋钮 。 为 了 识别 10 种 动物 ， 要 给 训练 
机 器 看 10 万 张 动物 图 片 ， 一 张 图 片 束 要 算 151 亿 次 乘法 和 加 法 ，10 万 张 
至 少 是 1 500 万 亿 次 运算 。 这 才 是 识别 10 种 动物 的 训练 运算 量 ， 如 果 要 
训练 识别 1 万 种 动物 呢 ? 用 今天 的 最 快 的 CPU (电脑 中 央 人 处理 器 ) 或 
GPU (图 形 处 理 器 ，， 也 要 算 几 个 月 甚至 几 年 。 对 计算 量 要 求 更 大 的 是 
识别 ， 识 别 一 张 图 片 要 算 150 亿 次 不 难 ， 但 Facebook 上 每 天 上 传 的 何止 
几 亿 张 照片 ? 降低 运算 量 就 意味 着 降低 成 本 。 

降低 运算 量 的 第 一 招 就 是 把 问题 分 类 ， 如 果 只 处 理 某 一 类 问题 ， 
针对 这 些 问题 的 共同 特点 ， 就 有 可 能 简化 算法 。 我 们 知道 ， 人 从 外 界 
获得 的 信息 90% 以 上 是 视觉 信息 ， 视 觉 信息 主要 是 图 像 ， 视 频 也 可 以 分 
解 成 快速 内 过 的 图 像 。 那 图 像 有 什么 特点 呢 ? 一 幅 图 像 的 信息 量 很 
大 ， 但 不 管 是 风景 还 是 人 物 ， 画 面 上 总 有 大 部 分 区 域 没 有 什么 变化 ， 
像 天 空 。 引 起 你 注意 的 东西 往往 都 是 一 小 块 ， 例 如 人 的 眼睛 、 天 空中 
的 鸟 、 地 上 的 花 。 这 个 叫 作 图 像 中 信息 的 局 域 性 。 图 像 的 第 二 个 特点 
是 可 以 分 解 为 更 简单 的 元 素 ， 例 如 风景 分 解 为 天 空 、 大 地 、 植 物 、 动 
物 ， 人 物 分 解 为 五 官 。 卷 积 神经 网 络 就 是 利用 图 像 的 以 上 两 个 特点 进 
行 了 大 幅度 的 运算 简化 。 

以 人 脸 识别 为 例 ， 要 识别 一 个 人 ， 先 要 抓 住 他 的 特征 ， 比 如 浓 丑 
大 眼 高 鼻梁 。 第 一 步 就 是 把 五 官 找 出 来 。 其 实 警 察 抓 犯罪 嫌疑 人 早 就 


用 了 这 一 招 。 警 察 局 的 画师 会 问 目击 者 犯 非 嫌疑 人 的 性 别 、 年 龄 、 喘 
高 、 种 族 等 ， 然 后 问 目 击 者 犯 菲 嫌疑 人 的 五 官 长 什么 样 ， 目 击 者 能 摘 
述 的 五 官 种 类 非常 有 限 ， 大 了 眼睛、 小 眼睛 ， 最 多 加 个 单眼 皮 、 双 了 眼 
皮 、 高 性 染 、 场 蛤 染 ， 根 据 目 击 者 的 描述 画师 画 出 一 幅 人 脸 ， 然 后 目 
击 者 再 说 眼角 级 下 ， 没 这 么 大 ， 男 师 再 不 断 改 ， 直 到 目击 者 觉得 和 记 
忆 基 本 相符 。 人 上 脸 那么 复杂 根本 无 法 用 语言 描绘 ， 但 如 果 变 成 五 官 的 
组 合 描绘 起 来 就 简单 多 了 。 假 设 每 个 五 官 都 能 分 10 种 ， 就 能 组 合 出 1 万 
种 脸 来 ， 再 加 上 年 龄 、 性 别 、 种 族 就 能 组 合 出 几 十 万 张 脸 ， 这 样 把 从 
70 亿 人 中 找 一 张 脸 的 任务 就 分 解 成 了 从 10 种 眼睛 中 找 出 一 种 眼睛 ， 再 
从 10 种 蜡 子 中 找 出 一 种 腊 子 这 样 简单 得 多 的 任务 。 


苍 积 神经 网 络 是 怎样 工作 的 


卷 积 神经 网 络 区 是 用 的 警察 局 这 一 招 。 假 如 我 们 现在 要 从 分 布 在 
北京 大 街 小 巷 的 摄像 头 的 视频 中 发 现 100 个 重要 的 犯罪 嫌疑 人 ， 第 一 步 
征用 这 些 犯 徘 嫌疑 人 的 已 有 照片 来 训练 机 器 。 训 练 的 第 一 步 就 是 要 从 
这 些 照片 中 提取 五 官 的 特征 。 因 为 五 官 在 一 张 照片 中 只 占 一 小 块 ， 那 
我 们 就 做 个 找 五 官 的 小 模板 ， 专 业 术 语 叫 滤波 器 ， 用 这 个 小 模板 在 要 
处 理 的 图 像 上 从 左 扫 到 右 ， 从 上 扫 到 下 ， 看 看 能 否 发 现 眼睛 ， 为 外 一 
个 小 模板 负责 发 现 蜡 子 等 。 什 么 叫 “ 发 现 腊 子 ”? 就 是 负责 发 现 眶 
的 小 模板 是 一 张 像 愉 子 的 图 案 ， 这 个 图 案 扫 到 具 子 处 时 重合 度 最 大 。 
什么 叫 提取 特征 ?就 是 一 开始 这 个 上 蛋子 图 案 是 个 随机 图 案 ， 像 是 随手 
那么 一 画 ， 扫 一 人 吉 下 来 发 现 没有 什么 重合 度 ， 那 就 变 一 变 这 个 图 案 ， 
最 后 变 得 和 犯罪 嫌疑 人 的 鼻子 很 像 时 ， 重 合 度 就 会 最 大 。 等 负责 找 出 
蜡 子 、 了 眼睛 、 嘴 巴 等 的 模板 图 案 剖 和 犯罪 嫌疑 人 的 吻合 后 束 算 训练 成 
功 了 。 以 后 你 输入 一 张 照 片 ， 机 器 就 可 以 飞速 地 告诉 你 这 个 是 不 是 犯 
徘 嫌 颖 人 。 


在 机 器 学 习 中 ， 是 机 器 自己 寻找 特征 。 一 开始 机 器 并 不 知道 要 找 
哪些 特征 。 所 以 这 些小 模板 并 不 知道 它们 要 找 鼻 子 或 眼睛 。 这 些小 模 
板 从 开始 的 一 个 随机 图 形 到 最 后 一 定 会 演变 成 五 官 吗 ? 答案 是 如 果 五 
官 是 人 脸 上 最 重要 的 特征 ， 这 些小 模板 到 最 后 一 定 会 演变 成 五 官 。 但 
神奇 的 是 机 器 还 能 发 现 我 们 人 类 都 没 注意 到 的 人 脸 上 的 重要 特征 。 假 
如 我 们 多 加 一 个 小 模板 变 成 六 个 ， 这 六 个 中 会 有 五 个 各 自 对 应 一 个 器 
官 ， 还 有 一 个 就 会 找到 一 个 新 的 特征 ， 如 两 眼 之 间 的 距离 ， 或 者 口 鼻 
之 间 的 距离 ， 等 等 。 所 以 小 模板 越 多 ， 抓 到 的 特征 就 越 多 ， 识 别 就 越 
准确 。 

现在 你 要 问 ， 这 个 小 模板 发 现 曙 子 和 前 面 讲 的 神经 网 络 黑 盒子 的 
调 旋 钮 是 什么 关系 ?其 实 这 个 小 模板 就 是 一 组 旋钮 ， 一 个 有 5X5=25 个 
像素 的 小 模板 就 相当 于 25 个 旋钮 ， 每 个 像素 的 颜色 浓度 对 应 着 一 个 旋 
钮 的 某 个 位 置 ， 调 旋钮 就 是 让 小 模板 里 的 图 案 越 来 越 像 犯 罪 嫌疑 人 的 
鼻子 。 我 们 之 前 讲 过 ， 这 个 “ 调 旋钮 ”不 是 人 工 调 的 ， 是 算出 来 的 。 

现在 我 们 可 以 看 看 到 底 省 了 多 少 计 算 量 ， 如 果 一 张 图 片 是 1 
024X1 024s100 万 像素 ， 每 个 像素 对 应 一 个 接收 神经 元 ， 每 层 有 100 
万 个 神经 元 ， 这 样 一 个 全 连接 的 神经 网 络 每 一 层 要 有 100 万 X100 万 =1 
万 亿 次 计算 。 现 在 只 要 五 个 小 模板 ， 每 个 负责 找到 五 官 中 的 一 个 。 每 
个 小 模板 把 图 片上 下 左右 扫 一 遍 的 计算 量 是 5X5X100 万 =2 500 万 次 ， 

5 个 模板 就 是 1. 25 亿 次 。 计 算 量 变 成 了 原来 的 万 分 之 一 ! 

我 现在 可 以 告诉 你 什么 叫 “ 卷 积 ”， 上 面 说 的 小 模板 把 图 片上 下 
左右 横扫 一 遍 发 现 重合 度 的 过 程 就 叫 卷 积 。 你 看 这 个 距 人 的 黑 科 技 名 
词 其 实 就 是 这 么 简单 的 一 回 事 。 

上 面 是 对 卷 积 神经 网 络 的 基本 原理 的 一 个 通俗 解释 。 对 于 想 更 深 
入 了 解 的 读者 可 以 看 附录 1 中 一 个 典型 卷 积 网 络 的 精确 描述 。 从 附录 1 
中 可 以 看 出 卷 积 神经 网 络 不 仅 是 一 个 高 阶 的 非 线性 网 络 ， 也 是 一 个 无 
法 用 方程 式 表达 的 函数 。 给 定 一 个 训练 数据 集 ， 最 后 这 些 数据 之 间 的 
相关 性 都 会 凝结 在 网 络 参数 里 。 或 者 说 神经 网 络 是 数据 相关 性 的 “ 东 


取 絮 ”。 但 茜 取 了 哪些 相关 性 ? 为 什么 茜 取 这 些 相 关 性 则 是 人 们 未 必 
能 理解 的 。 比 如 人 上 脸 识别 ， 机 器 抓 取 的 用 于 识别 的 人 脸 特征 可 能 是 人 
类 不 熟悉 的 那些 特征 ， 甚 至 完全 没有 意识 到 的 特征 。 对 于 那些 人 类 感 
官 无 法 感受 的 复 淋 数据 集 ， 比 如 一 个 核电 三成 干 上 万 个 子 系统 产生 的 
数据 以 及 它们 之 间 的 相关 性 ， 那 更 是 人 类 完全 无 法 理解 的 。 


卷 积 神经 网 络 能 做 哪些 事 


首先 ， 几 乎 所 有 的 图 像 类 的 处 理 ， 如 图 像 分 类 、 人 脸 识 别 、X 光 读 
片 ， 都 适合 用 卷 积 神经 网 络 。 网 像 分 类 最 车 名 的 大 赛 就 是 斯 坦 福 大 学 
李 飞 飞 教 授 创 办 的 ImageNet 〈 计 算 机 视觉 系统 识别 项 目 ， 是 目前 世界 
上 图 像 识 别 最 大 的 数据 库 ) 大 赛 。 这 个 大 赛 提 供 1 000 种 不 同 物体 的 几 
百 万 张 图 片 让 参赛 者 训练 自己 的 模型 ， 参 赛 时 给 大 家 一 些 新 的 图 片 让 
参赛 者 识别 ， 看 谁 的 识别 准确 率 最 高 。2012 年 辛 顿 的 学 生 亚 历 克 斯。 
克 里 捷 夫 斯 其 (Alex Krizhevsky) 第 一 次 用 一 个 5 层 的 卷 积 神经 网 络 
就 把 多 年 徘徊 在 74% 的 准确 率 一 举 提 高 到 84%， 震 司 了 业界 。 到 2015 年 
微软 的 152 层 ResNet 把 准确 率 提高 到 了 96%， 超 过 了 人 类 的 准确 率 95%。 
从 那 以 后 进展 就 越 来 越 小 。 有 些 公 司 组 织 大 量 的 人 力 ， 采 集 更 多 的 训 
练 图 片 ， 尝 试 更 多 的 小 模板 ， 更 精心 地 微调 那些 旋钮 ， 最 后 能 达到 比 
现 有 结果 好 0. 1%， 然 后 就 可 以 宣称 自己 是 世界 第 一 了 。 但 这 个 世界 第 
一 意义 不 大 ， 因 为 没有 在 网 络 结构 上 和 算法 上 有 任何 创新 ， 当 时 人 家 
一 个 研究 生 Alex 一 举 提高 10 个 百分点 ， 你 扑 上 去 几 十 上 百人 提高 0. 1 个 
百分点 ， 不 算 本 事 。 对 不 懂 卷 积 神经 网 络 的 投资 人 、 股 民 、 政 府 官 员 
来 说 ， 这 块 “世界 第 一 ”的 牌子 还 挺 距 人 的 。 但 读 到 这 里 你 以 后 就 不 
会 被 忽悠 了 。 


更 有 用 的 是 通过 识别 一 张 图 片 中 所 有 的 物体 ， 甚 至 发 现 物体 之 间 
的 关系 来 “理解 ”这 张 图 片 。 璧 如 机 器 看 完 一 张 图 片 后 会 说 出 来 “ 蓝 


天 上 白云 下 ， 一 位 戴 草 帽 的 年 轻 妈 妈 在 草地 上 教 孩子 学 走路 ， 她 们 的 小 
狮子 狗 在 劳 边 卧 痢 ”。 


X 光 读 片 也 是 卷 积 神经 网 络 一 个 很 好 的 应 用 。 假 如 要 在 胸 片 中 发 现 
早期 肺癌 ， 就 需要 拿 大 量 已 经 确诊 的 早期 肺癌 片子 来 训练 机 嚣 ， 这 样 
训练 好 的 机 器 就 可 以 快速 地 发 现 肺 癌 。 随 着 X 光 仪 、CT 机 等 医疗 成 像 设 
备 的 普及 ， 有 经 验 的 读 片 医生 非常 稀缺 。 特 别 是 在 小 城市 、 县 城 、 乡 
村 更 缺乏 这 样 的 好 医生 。 如 果 机 器 读 片 能 够 达到 甚至 超过 北京 、 上 海 
大 医院 有 经 验 的 医生 ， 将 是 普 惠 医疗 的 一 个 巨大 进展 。 我 们 在 第 六 章 
会 专门 讲 AI 在 医疗 健康 领域 的 应 用 ， 包 括 X 光 读 片 的 现状 和 挑战 。 

卷 积 神经 网 络 虽 然 应 用 很 三 ， 但 它 解 决 不 了 一 些 重 要 的 问题 ， 如 
股票 预测 和 目 然 语 言 理解 。 下 面 我 们 就 介绍 可 以 解决 这 类 问题 的 另 一 
个 很 牛 的 网 络 。 


处 理 序列 信息 的 循环 神经 网 络 


为 什么 需要 循环 神经 网 络 


卷 积 神 经 网 络 可 以 处 理 图 像 分 类 和 识别 。 图 像 信 息 处 理 的 特点 是 
一 张 图 像 的 所 有 信息 同时 给 你 ， 而 且 下 一 张 图 像 和 上 一 张 图 像 可 以 完 
全 没有 关系 ， 吏 像 是 吃 一 盘 饺 子 ， 先 吃 哪 个 后 吃 哪个 都 无 所 谓 。 但 目 
然 界 还 有 力 外 一 类 信息 和 图 像 不 同 ， 信 息 的 先后 顺序 很 重要 ， 不 能 前 
后 其 倒 ， 像 目 然 语 言 、 股 票 曲线 、 天 气 预 报 数据 等 。 和 图 像 信 息 的 忆 
一 个 不 同 之 处 在 于 这 些 信息 是 连续 产生 的 ， 无 法 分 成 一 块 一 块 的 ， 像 
-次 喝 进 去 一 瓶 啤酒 ， 你 无 法 清楚 地 分 成 几 十 “ 口 ”， 你 就 是 这 么 中 
嘟 咕嘟 连 着 灌 下 去 的 。 我 们 把 图 像 这 样 不 分 先后 的 信息 称 为 “空间 信 
晨 ”， 把 连续 的 、 有 先后 顺序 的 称 为 “时 间 信 息 ” 或 “序列 信息 ”。 


卷 积 神 经 网 络 每 次 能 处 理 的 信息 都 是 个 固定 的 量 ， 所 以 不 适合 处 理 连 
续 发 生 的 信息 。 


于 是 ， 一 种 不 同 的 神经 网 络 一 一 循环 神经 网 络 就 应 运 而 生 了 ， 它 
的 结构 比 卷 积 神经 网 络 还 复杂 。 但 循环 网 络 背 后 的 直 党 和 道理 不 难 
懂 ， 其 实 掌握 一 门 学 科 最 重要 的 是 理解 背后 的 直觉 ， 有 些 研究 生 、 工 
程 师 可 以 背 很 多 方程 式 ， 写 很 多 程序 ， 但 对 背后 的 直 沉 并 不 清晰 ， 这 
就 大 大 限制 了 他 们 的 想象 力 和 创造 力 。 我 们 这 本 书 的 目的 不 是 要 把 大 
家 训练 成 工程 师 ， 而 是 通过 弄 懂 背后 的 道理 来 对 这 个 未 来 的 大 潮流 有 
高 屋 建 领 的 理解 ， 从 而 产生 全 局 性 的 把 握 。 

在 介绍 循环 神经 网 络 之 前 ， 我 们 先 看 个 例子 。 壁 如 我 们 在 下 面 的 
句子 里 猜 词 填 空 ; “我 是 广东 人 ,会 讲话 。” 在 这 里 如 果 我 们 没 
有 看 到 第 一 句 “ 我 是 广东 人 ” 束 很 难 填空 。 这 就 是 一 个 典型 的 根据 前 
面 出 现 的 信息 对 后 面 可 能 会 出 现 的 信息 的 预测 。 循 环 神经 网 络 就 特别 
适合 处 理 这 类 问题 。 这 个 网 络 有 两 个 特点 ， 分 别 对 应 时 间 序 列 信息 的 
两 个 特点 : 一 是 输入 端 可 以 接收 连续 的 输入 ， 二 是 可 以 记 住 信息 的 先 
后 顺序 。 


循环 神经 网 络 背 后 的 直觉 


现在 我 们 看 看 循环 神经 网 络 如 何 做 这 样 的 预测 。 像 其 他 神经 网 络 
一 样 ， 第 一 步 是 训练 机 器 。 我 们 先 一 句 一 句 地 训练 ， 比 如 训练 的 第 一 
句 吏 是 “我 是 上 海 人 ， 会 讲 上 海 话 ”。 一 开始 训练 机 费时 ， 给 机 器 一 
个 “我 ” 字 ， 机 融会 乱 预 测 ， 比 如 预测 出 下 个 字 是 介词 “但 ”， 可 
“我 但 ” 没 意 义 。 机 器 和 训练 样本 一 比 知 道 自 己 错 了 ， 就 去 调 黑 盒 子 
上 的 旋钮 ， 一 直 调 到 机 器 会 在 “我 ”后 面 预 测 出 “是 ”来 。 训 练 束 是 
这 样 给 机 器 读 大 量 的 各 种 各 样 的 句子 ， 当 机 器 读 了 很 多 以 “我 ”开始 
的 句子 时 ， 整 会友 现 “我 ”后 面 一 定 是 动词 ， 特 别 是 关系 动词 或 能 愿 
动词 ， 像 “我 是 ”“ 我 要 ”。 但 “我 ”后 面 可 以 有 很 多 动词 ，“ 我 


想 ”“ 我 吃 ”“ 我 喝 ”， 到 诬 选 哪个 呢 ? 这 就 需要 更 前 面 的 信息 了 。 
所 以 循环 神经 网 络 要 存储 前 面 的 信息 。 当 机 器 读 了 很 多 “我 是 上 海 
人 ， 会 讲 上 海 话 ”“ 我 是 河南 人 ， 会 讲 河南 话 ” 这 类 的 句子 后 ， 束 会 
慢 慢 发 现 规律 ， 这 时 候 你 让 它 填 “ 我 是 广东 人 ， 会 讲 。 _ 话 ” 的 空 
时 ， 它 就 把 我 是 “什么 ”人 那个 “什么 ”给 填 进去 了 。 

这 时 候 你 会 问 ， 这 好 像 不 用 这 么 复 杀 的 神经 网 络 吧 ， 只 要 统计 每 
个 词 后 面 出 现 的 词 的 概率 ， 然 后 预测 哪个 概率 最 高 不 就 得 了 ? 过 去 的 
确 是 这 么 做 的 ， 但 效果 不 好 ， 像 我 们 前 面 举 的 例子 ，“ 我 ”后 面 的 可 
能 性 太 多 了 。 那 你 会 接着 说 : “我 们 也 统计 前 面 更 多 的 字 不 就 得 
了 ? ” 那 我 问 你 ， 统 计 前 面 多 少 个 字 呢 ? 要 不 要 把 词组 和 短 句 也 作为 
一 个 单位 来 统计 ? 但 词组 和 短 句 多 得 数 不 清 ， 你 怎么 教会 机 器 认识 哪 
些 是 词组 ?你 会 友 现 越 深究 问题 残 越 多 ， 而 且 问 题 变 得 无 穷 复 森 ， 以 
至 于 都 不 知道 该 提取 哪些 特征 。 而 神经 网 络 可 以 自动 找到 那些 人 类 找 
不 到 的 或 者 根本 没 意 识 到 的 前 后 信息 之 间 的 相关 性 。 就 像 我 们 之 前 讲 
到 卷 积 神经 网 络 不 仅 能 找到 人 脸 的 五 官 特征 ， 还 能 找到 人 平时 不 注意 
的 其 他 特征 如 两 眼 间距 等 。 


有 兴趣 的 读者 可 以 看 附录 2 里 面 关 于 循环 神经 网 络 的 技术 介绍 。 从 
附录 2 里 可 以 看 出 由 于 循环 神经 网 络 里 有 反馈 回路 ， 整 个 网 络 更 是 一 个 
高 度 非 线 性 、 无 法 解析 表达 的 网 络 。 循 环 网 络 禁 取出 的 数据 在 时 间 上 
的 相关 性 更 是 人 类 无 法 感受 和 理解 的 瞳 知 识 。 因 为 人 脑 非常 不 善于 存 
储 很 长 一 段 时 间 的 信息 。 


循环 神经 网 络 的 神奇 应 用 


人 循环 神经 网 络 的 第 一 个 重要 应 用 古 机 器 翻译 。 机 器 翻译 最 早 是 语 
言 学 家 手工 写 一 大 堆 语 法 ， 然 后 根据 单词 出 现 的 顺序 用 语法 把 它们 组 
织 起 来 。 这 是 典型 的 “专家 系统 ”。 我 们 前 面 讲 过 ， 这 样 的 手工 系统 
无 法 应 付 千变万化 的 上 自然 语言 。 后 来 的 机 器 学 习 翻 译 就 是 前 面 说 过 的 


统计 方法 ， 统 计 大 量 的 句子 中 每 个 字 出 现在 另外 一 个 字 之 后 的 频率 ， 
然后 挑选 最 可 能 出 现 的 那个 字 。 我 们 前 面 也 说 了 这 种 方法 的 局 限 性 。 
现在 最 新 、 最 牛 的 机 器 翻译 ， 从 谷歌 、Facebook、 微 软 到 百度 统统 都 
是 用 循环 神经 网 络 。 翻 译 和 前 面 的 填空 例子 相 比 ， 多 了 可 用 的 信息 。 
例如 英文 “I am Chinese, I can speak mandarin” 可 以 翻译 成 中 文 
“我 是 中 国人 ， 会 讲 普通 话 ”， 机 器 翻译 除了 可 以 根据 前 面 出 现 的 中 
文 词 预测 后 面 的 中 文 词 之 外 ， 还 可 以 根据 整个 英文 句子 和 整个 中 文句 
子 之 间 的 对 应 关系 来 提高 预测 的 准确 性 。 这 就 是 目前 最 广泛 使 用 的 
“编码 器 -解码 器 ”翻译 模型 。 这 里 用 两 个 循环 神经 网 络 ， 一 个 网 络 先 
把 整个 英文 句子 的 结构 信息 都 压缩 到 一 个 字符 中 ， 然 后 第 二 个 网 络 在 
一 个 字 一 个 字 地 预测 时 可 以 根据 这 个 包含 了 整个 句子 的 结构 信息 做 辅 
助 判 断 。 机 器 翻译 正 处 在 技术 突破 的 边缘 ， 一 旦 突破 将 给 我 们 的 生活 
带 来 巨变 。 

机 器 学 习 不 仅 在 科学 技术 的 进步 上 大 显 神威 ， 也 开始 进入 人 文 领 
域 。 循 环 神经 网 络 第 二 个 有 意思 的 应 用 是 写 许 。 我 们 会 在 第 六 章 中 详 
细 介 绍 。 同 样 的 道理 ， 还 可 以 写 小 说 。 只 要 让 机 器 大 量 阅 读 一 位 作者 
的 著作 ， 机 器 就 会 学 会 这 个 作者 的 文字 风格 ， 甚 至 可 以 写 出 海明威 风 
格 的 《红楼 梦 》， 或 者 曹 雪 扩 风格 的 《老人 与 海 》。 


循环 神经 网 络 很 神奇 ， 但 我 们 下 面 要 介绍 的 “强化 学 习 ” 更 神 
奇 。 


AlphaGo 与 强化 学 习 


机 器 学 习 运 今 为 止 最 让 人 类 惊奇 的 表现 整 古 下 围棋 。 下 围棋 的 问 
题 是 当 我 每 走 一 步 时 ， 如 何 使 得 最 终 赢 棋 的 概率 最 大 ? 如果 我 不 走 150 
步 ， 只 走 两 步 ， 每 步 双方 只 随机 选 5 种 走 法 ， 我 走 第 一 步 有 五 种 选择 ， 


对 方 对 我 这 五 种 选择 的 每 一 种 又 有 五 种 选择 ， 我 走 第 二 步 一 共有 
5X5X5=125 种 选择 。 但 通常 走 完 两 步 离 终局 还 很 远 ， 那 我 从 走 完 第 二 
步 的 这 125 个 位 置 上 各 派出 一 批 “ 侦 察 兵 ”， 每 个 “侦察 兵 ” 蒙 着 头 一 
条 道 走 到 黑 ， 看 到 贫 路 任 选 一 条 ， 尽 快走 到 终局 ， 如 果 猜 对 了 ， 给 这 
个 出 发 点 加 一 分 ， 猜 错 了 ， 减 一 分 。 从 每 个 位 置 上 派出 的 “侦察 兵 ” 
越 多 ， 从 这 125 个 出 发 点 到 终局 的 赢 率 就 越 准确 。 这 个 “有 限 出 发 点 ， 
随机 侦察 ”的 方法 有 个 吓人 的 专业 名 字 叫 “蒙特 卡 洛 树 搜索 ”。 蒙 特 
卡 洛 是 摩纳哥 的 赌场 区 ， 所 以 蒙特 卡 洛 就 是 “随机 ”的 意思 。 


但 这 种 下 棋 策 略 只 能 勉强 达到 一 二 段 的 业余 水 平 ， 与 围棋 大 师 相 
比 还 差 得 很 远 。 为 什么 ? 

因为 “侦察 兵 ” 往 前 走时 随机 选 岔 道 实 际 上 是 随机 地 蔡 对 方 选 了 
走 法 。 我 们 不 禁 会 想到 :; 见 到 岔路 随机 选 多 笨 ， 完 全 可 以 根据 阳光 、 
爸 苦 、 足 迹 这 些 东西 做 个 判断 。“ 侦 察 兵 ”很 委屈 地 说 : 我 怎么 知道 
该 怎样 判断 ? AlphaGo 寻 思 说 : “人 类 2 000 多 年 下 了 那么 多 盘 棋 ， 虽 
能 不 能 先 学 学 ? ”这 时 候 AljphaGo 和 祭 出 了 大 法 器 ， 就 是 我 们 前 面 讲 过 的 
卷 积 神经 网 络 。 

卷 积 神经 网 络 最 适合 处 理 图 像 ， 经 过 大 量 图 片 的 训练 后 ， 你 给 它 
个 新 的 图 片 ， 它 告诉 你 是 猫 、 狗 、 汽 车 的 概率 分 别 有 多 少 。 对 于 下 
棋 ， 问 题 转化 成 : 给 个 中 盘 ， 要 判断 哪 种 走 法 赢 的 概率 最 大 。 在 人 类 
下 过 的 棋局 中 ， 每 个 中 盘 都 对 应 着 一 个 走 法 。 现 在 可 以 把 一 个 中 盘 看 
成 一 幅 图 像 ， 把 对 应 的 走 法 看 成 与 这 个 图 像 对 应 的 物体 。 现 在 找到 中 
盘 最 好 的 走 法 就 相当 于 判断 这 幅 图 像 最 像 哪 个 物体 。 那 我 就 拿 人 类 下 
过 的 棋局 来 训练 AlphaGo 里 负责 走 子 的 卷 积 神经 网 络 一 一 决策 网 络 。 现 
在 把 3 000 万 个 人 类 走 过 的 中 盘 输 入 给 决策 网 络 ， 调 整 决策 网 络 上 的 旋 
钮 ， 一 直到 这 个 网 络 的 走 法 和 人 的 走 法 类 似 。 现 在 AlphaGo 已 经 是 七 八 
段 的 水 平 了 ， 但 还 打 不 过 大 师 ， 为 什么 ? 虽然 现在 “侦察 兵 ” 每 一 步 
都 是 按 人 类 的 走 法 ， 但 “侦察 兵 ” 的 每 一 步 只 是 奉 对 方 随机 选 一 个 。 
如 果 能 让 对 方 的 选择 也 按 人 类 的 走 法 ， 这 条 路 对 弈 下 去 台 更 逼真 了 。 


AlphaGo 这 时 候 拔 了 号 上 一 根 蝇 毛 ， 吹 口 仙 气 儿 ，“ 变 ! ”又 “ 变 ” 出 
一 个 一 横 一 样 的 AljphaGo。 哥 俩 都 是 八 段 ， 再 大 战 百 万 回合 ， 又 摸索 出 
很 多 原来 人 类 没有 探索 过 的 捷径 ， 又 产生 了 很 多 数据 ， 继 续 训 练 决策 
网 络 ， 没 多 长 时 间 融 打败 了 李 世 石 ， 再 练 一 阵子 ， 在 网 上 打出 Master 
的 旗号 ， 横 扫 天 下 高 手 ， 无 一 失手 ， 直 全 把 柯 洁 挑 下 马 。 


前 面 介绍 的 无 论 是 卷 积 神经 网 络 还 是 循环 神经 网 络 都 需要 大 量 的 
训练 数据 ， 这 也 叫 “ 监 督学 习 ”。 在 “监督 学 习 ” 中 通常 有 唯一 或 明 
确 的 答案 ， 猫 就 是 猫 ， 狗 就 是 狗 。 但 生活 中 还 有 一 类 问题 是 没有 明确 
答案 的 。 例 如 我 们 学 习 骑 自行 车 ， 没 有 人 能 说 清楚 正确 姿势 是 什么 ， 
不 管 你 姿势 多 难看 ， 骑 上 去 不 摔 倒 就 是 对 的 。 这 类 问题 的 特点 是 答案 
不 唯一 但 知道 结果 的 对 错 。 这 种 通过 每 次 结果 的 反馈 逐渐 学 习 正 确 
“行为 ”的 算法 就 叫 “ 强 化 学 习 ”。 在 强化 学 习 算法 中 有 一 个 “奖惩 
函数 ”， 不 同 的 行为 会 得 到 不 同 的 奖惩 。 壁 如 我 们 在 楼 里 打 电 话 时 ， 
如 果 信 号 不 好 ， 我 们 就 拿 着 手机 ， 边 走边 问 对 方 “ 能 听 到 吗 ? ”。 我 
们 得 到 的 信息 并 不 能 直接 告诉 我 们 哪里 信号 最 好 ， 也 无 法 告诉 我 们 下 
一 步 应 该 往 哪个 方向 走 ， 每 一 步 的 信息 只 能 让 我 们 评估 当前 的 状况 是 
更 好 还 是 更 差 。 我 们 需要 走动 、 测 试 ， 以 决定 下 一 步 应 该 往 哪儿 走 。 
AlphaGo 的 随机 树 搜索 就 是 强化 学 习 ， 通 过 派出 “侦察 兵 ” 来 测试 某 种 
走 法 的 局 率 。 启 了 加 一 分 ， 输 了 减 一 分 ， 这 就 是 强化 学 习 中 的 奖惩 函 
数 ， 存 储 各 种 走 法 输赢 积分 的 网 络 也 叫 “ 价 值 网 络 ”。 哥 俩 对 战 就 是 
站 在 人 类 肩膀 上 的 强化 学 习 。 所 以 AlphaGo 是 监督 学 习 和 强化 学 习 的 混 
合 方式 。 

在 AlphaGo 的 学 习 过 程 中 ， 人 类 的 3 000 万 中 盘 仅 仅 把 它 领 入 门 而 
已 ， 进 步 主 要 靠 哥 俩 自己 所 杀 。 相 当 于 你 去 学 围棋 ， 一 开始 跟着 你 爸 
学 ， 你 耸 就 是 个 业余 选手 ， 你 两 个 星期 就 跟 你 耸 学 不 了 什么 了 ， 以 后 
都 要 靠 自 己 琢 磨 了 。AlphaGo 也 一 样 ， 想 清楚 这 点 ， 干 脆 从 零 开 始 ， 人 
类 2 000 多 年 积累 的 东西 也 许 就 是 老 爸 那 点 业余 水 平 ， 学 不 学 无 所 谓 。 
AlphaGo Zero 横 空 出 世 了 ， 这 个 “Zero” 就 是 从 零 学 起 的 意思 。 
AlphaGo Zero 从 一 开始 就 是 哥 俩 自 娱 自 乐 ， 和 AlphaGo 不 同 的 是 ， 在 下 


每 一 步 棋 之 前 ， 不 需要 随机 地 选 125 个 出 发 点 了 ， 而 是 根据 当前 的 小 路 
“记号 ”和 打分 先 在 这 个 中 盘 选 一 个 最 可 能 赢 的 走 法 和 “双胞胎 弟 
第 ” 试 走 一 次 到 终局 ， 试 走 过 程 中 每 一 步 双 方 都 用 同一 个 决策 网 络 指 
导 如 何 走 子 。 这 个 决策 网 络 的 功能 很 简单 : 给 我 一 个 中 盘 ， 我 告诉 你 
所 有 走 法 的 赢 率 ， 这 样 一 次 到 终局 后 就 对 从 这 个 走 法 出 发 的 路 是 人 否 能 
赢 多 了 点 信息 。 一 路 上 边 走 边 做 记号 ， 第 一 ， 记 住 有 没有 走 过 这 条 
路 ; 第 二 ， 等 到 了 终局 后 根据 输赢 再 记 下 这 条 路 的 好 坏 。 这 个 “做 记 
号 ”就 是 不 断 更 新 价值 网 络 。 这 样 在 同一 个 中 盘 哥 俩 试 走 了 几 万 次 到 
终局 ， 基 本 摸 清 哪 条 路 好 走 ， 哪 条 路 不 好 走 ， 也 就 是 对 于 这 个 中 盘 我 
己 经 估 摸 出 了 所 有 走 法 的 说 率 。 此 时 ， 我 用 几 万 次 试 走出 来 的 说 率 来 
更 新 决策 网 络 。 更 新 的 方法 就 是 用 这 个 中 盘 做 网 络 的 输入 ， 调 试 网 络 
权重 系数 让 输出 的 各 走 法 局 率 接近 试 走 测 出 来 的 赢 率 。 这 一 切 做 完 后 
再 根据 测 出 的 赢 率 郑重 地 正式 走 一 步 棋 。 哥 哥 下 完 一 步 该 弟弟 走 了 ， 
第 第 的 程序 和 哥哥 完全 一 样 ， 也 是 先 试 走 许多 次 ， 用 测 出 来 的 启 率 更 
新 决策 网 络 ， 再 根据 测 出 来 的 启 率 走 和 所。 以 后 哥 俩 就 这 么 不 断 重 复 下 
去 。AlphaGo Zero 诞 生 后 的 第 一 局 的 第 一 个 中 盘 ， 哥 俩 完全 是 乱 下 ， 
但 第 一 盘 走 完 就 多 了 一 点 点 知识 ， 哥 俩 用 这 点 可 怜 的 知识 走 第 二 盘 就 
比 第 一 盘 靠 谱 了 一 点 点 ， 架 不 住 计 算 能 力 强 大 ，AlphaGo Zero 每 秒 钟 
可 以 走 8 万 步 ， 平 均一 盘 棋 不 到 400 步 ， 所 以 哥 俩 一 秒 钟 相 当 于 下 200 盘 
棋 。 每 盘 长 进 一 点 ， 到 第 7 个 小 时 ， 也 就 是 相当 于 下 了 500 万 盘 棋 后 就 
下 得 像 模 像样 了 。 一 天 半 后 ， 也 就 是 相当 于 下 了 2 600 万 盘 棋 后 就 超过 
了 战胜 李 世 石 的 AlphaGo Lee。3 天 后 ，AlphaGo Zero 就 和 AlphaGo Lee 
打 了 个 100: 0。AlphaGo Lee 一 共 学 了 3 000 万 个 中 盘 ， 大 致 相当 于 3 
000 万 /400=8 万 盘 棋 ， 这 时 AlphaGo Zero 已 经 相当 于 下 了 5 100 万 得 
棋 。21 天 后 就 打败 了 横扫 天 下 无 敌手 的 AlphaGoMaster， 到 40 天 后 哥 俩 
已 经 受 妥 地 称霸 天 下 ， 独 抓 求 败 。 到 这 里 ，AlphaGo 团 队 终 于 松 了 口 
气 ， 放 下 了 原先 的 一 个 最 大 担忧 如 果 不 让 人 类 引进 门 ， 从 零 学 起 ， 
这 哥 俩 会 不 会 在 野地 里 瞎 竹 ， 在 林子 里 迷路 ， 像 梦游 一 样 原 地 绕 大 
圈 ， 永 远 都 走 不 出 来 。 这 证 明了 在 强化 学 习 中 只 要 每 一 步 都 知道 对 


错 ， 有 惩罚 奖励 ， 哥 俩 很 快 就 会 放弃 那些 明显 不 通 的 绝 大 部 分 的 道 
路 ， 很 快 就 会 找到 一 条 正路 。AlphaGo 用 了 1 200 个 CPU，176 个 GPU， 而 
AlphaGo Zero 只 用 了 4 个 TPU〈 张 量 处 理 单元 ) 。 计 算 资 源 的 大 幅度 下 
降 主要 来 自 算 法 的 精简 ， 不 需要 用 人 类 数据 训练 了 。 由 此 可 见 ， 在 不 
同 的 应 用 场景 下 ， 数 据 并 非 都 那么 重要 。 在 下 围棋 这 件 事 上 ， 人 类 的 
经 验 反而 拖 了 后 腿 。AlphaGo Zero 给 我 们 最 重要 的 启示 是 柯 洁 说 的 那 
句 话 ，“ 人 类 下 了 2 000 年 围棋 ， 连 边 儿 都 没 摸 着 ”。 非 常 原始 的 机 器 
在 上 自己 摸索 了 36 个 小 时 后 ， 束 超过 了 全 人 类 2 000 年 来 摸索 积累 的 全 部 
围棋 知识 。 


现在 请 大 家 思考 三 个 问题 : 

为 什么 AlphaGo Zero 从 零 学 起 反而 比 人 强 ? 
AlphaGo Zero 再 从 头 学 一 遍 ， 功 力 还 和 原来 一 样 吗 ? 
AlphaGo Zero 是 不 可 战胜 的 吗 ? 


神经 网 络 悖 论 


读者 到 这 里 会 发 现 一 个 悍 论 : 神经 网 络 是 模仿 人 脑 ， 怎 么 能 够 发 
现 和 掌握 人 脑 无 法 擎 握 的 知识 ? 我 们 知道 目前 的 半导体 芯片 中 的 人 工 
神经 网 络 只 是 对 大 脑 的 一 个 简单 模仿 ， 无 论 是 在 神经 元 数量 还 是 在 连 
接 的 复杂 性 上 都 远 不 如 人 脑 。 到 底 是 什么 原因 使 得 人 工 神 经 网 络 能 够 
在 发 现 隐 蔽 的 相关 性 方面 远 超 人 脑 ， 创 造 出 如 此 多 的 神 迹 呢 ? 


第 一 个 原因 是 人 的 感官 和 机 器 的 “感官 ” 相 比 实在 太 差 。 人 的 感 
官 在 几 亿 年 的 进化 中 主要 是 为 了 在 自然 界 中 况 食 和 求偶 。 所 以 只 能 感 
受到 部 分 外 部 世界 信息 。 比 如 眼睛 只 能 看 到 光谱 中 的 可 见 光 这 一 小 
段 ， 无 法 “看 见 ” 从 无 线 电 小 到 坚 米 波 再 到 远 红 外 的 电磁 波 ， 也 无 法 


“看 见 ” 从 紫外 线 到 X 射 线 再 到 伽 马 射线 。 人 的 耳 条 也 听 不 到 20 赫 效 以 
下 的 亚 声 波 和 20 000 赫 效 以 上 的 超声 流 。 不 仅 如 此 ， 人 类 的 视觉 和 听 
觉 对 强度 的 分 辨 率 非 常 粗糙 ， 只 能 分 出 数量 级 。 人 类 的 触觉 、 嗅 觉 、 
味觉 分 辩 率 更 是 粗糙 。 而 机 器 的 “感官 ”， 就 是 各 类 物理 、 化 学 、 生 
物 类 的 传感器 则 比 人 的 感官 精密 得 多 。 不 仅 可 以 “感受 ”到 人 类 感受 
不 到 的 信息 ， 对 信息 的 分 辨 率 也 远 超 人 类 。 如 果 有 办 法 把 这 些 传感器 
信号 不 经 过 人 类 感官 直接 输入 大 脑 ， 人 类 大 脑 也 能 和 机 器 一 样 发 现 数 
据 间 复 杂 隐 蔽 的 相关 性 吗 ? 大 脑 能 处 理 高 分 辩 率 的 外 界 信息 吗 ? 我 们 
可 以 合理 地 推测 出 大 脑 的 进化 应 该 和 感官 相 匹 配 。 如 果 感 官 只 能 提供 
低 分 辨 率 信 息 ， 大 脑 处 理 高 分 辨 率 信息 的 能 力 就 是 一 种 浪费 ， 这 种 功 
能 要 么 不 可 能 演化 出 来 ， 要 么 即使 偶然 变异 出 来 也 会 被 进化 无 情 地 消 
灭 ， 

第 二 个 原因 是 电子 神经 元 比 生 物 神经 元 的 传输 信号 速度 快 ， 准 确 
度 高 。 由 于 人 脑 神经 元 在 突 触 部 分 的 信号 是 通过 化 学 分 子 传 导 的 〈 细 
胞 膜 内 外 带电 的 离子 浓度 差 造 成 电压 差 〉， 每 秒 钟 大 约 只 能 传导 400 次 
信号 。 而 电子 神经 元 间 的 传输 速度 就 是 芯片 上 不 同 晶体 管 之 间 的 传输 
速度 ， 比 人 脑 神经 元 要 快 几 万 倍 。 人 脑 神经 元 突 触 之 间 的 传输 非常 不 
可 靠 ， 平均 每 次 传输 的 成 功率 只 有 30%〔 这 种 随机 性 也 许 是 意识 “ 涌 
现 ” 的 重要 条 件 之 一 ) ， 而 电子 神经 元 之 间 的 传输 可 靠 性 几乎 是 
100%。 人 脑 神经 元 由 于 结构 复杂 ， 不 同 神经 元 之 间 的 电信 号 会 互相 干 
扰 ， 而 电子 神经 元 之 间 的 干扰 可 以 忽略 不 计 。 所 以 人 脑 神经 元 是 一 个 
慢 腾腾 的 老 出 错 的 系统 ， 而 电子 神经 元 是 一 个 高 速 的 精密 系统 。 

第 三 个 原因 是 目前 还 没有 办 法 获得 大 脑 内 部 每 一 个 神经 元 的 连接 
强度 。 即 使 我 们 有 办 法 把 外 界 传感器 信号 直接 输入 大 脑 ， 大 脑 也 可 以 
处 理 这 些 信息 ， 这 些 信息 也 只 能 被 雪藏 在 一 个 人 的 脑子 里 ， 成 为 无 法 
沟通 、 无 法 传播 、 无 法 记录 的 默 知 识 。 但 电子 神经 网 络 中 的 每 一 个 神 
经 元 之 间 的 连接 强度 ， 也 就 是 两 个 神经 元 连接 的 权重 系数 都 是 可 以 存 
储 、 提 取 的 。 所 以 机 器 获得 的 瞳 知识 是 可 以 传播 、 复 制 、 记 录 的 。 


所 以 对 这 个 悖 论 的 回答 是 ， 人 工 神经 网 络 虽 然 是 模仿 大 脑 ， 但 它 
具备 了 人 类 没有 的 三 个 优势 : 能 “感受 ”人 类 感受 不 到 的 信息 ， 与 人 
脑 相 比 又 快 又 准 ， 每 一 个 神经 元 的 状态 都 是 可 测量 的 。 


神经 网 络 五 大 研究 前 沿 


之 前 介绍 的 几 种 神经 网 络 都 是 目前 商用 中 的 主流 算法 ， 但 机 需 学 
习 的 潜力 还 远 没有 被 挖 尽 ， 现 在 每 年 关于 机 器 学 习 的 论文 还 在 呈 指 数 
级 增长 ， 在 研究 型 的 大 学 里 任何 关于 机 顺 学 习 的 谍 程 都 爆满 。 可 以 预 
期 在 今后 3 5 年 中 还 会 不 断 有 新 的 算法 突破 ， 下 面 介 绍 的 都 是 目前 炙 手 
可 热 的 研究 方向 ， 每 一 个 方 同 的 突破 都 会 产生 巨大 的 商业 价值 。 


非 监督 学 习 


在 前 述 的 机 器 学 习 算法 中 ， 我 们 总 有 一 个 训练 数据 集合 ， 即 “ 标 
注 数 据 ”， 如 所 有 汽车 图 片 都 会 标注 上 “汽车 ”， 所 有 猫 的 图 片 都 会 
标注 上 “ 猎 ” 每 。 这 样 在 训练 的 输出 端 ， 我 们 残 知道 结果 是 舍 正 确 ， 
因此 可 以 用 正确 结果 和 输出 结果 的 差 来 训练 机 器 (调整 各 层 的 权重 系 
数 ) ， 就 像 一 个 妈妈 教 孩 子 认识 东西 ， 这 类 算法 叫 “ 监 督学 习 ”。 在 
机 器 学 习 中 还 有 一 种 算法 不 依赖 于 “标注 数据 ”， 叫 “ 非 监督 学 
习 ”， 像 一 个 孩子 在 没 人 教 的 情况 下 目 己 学 习 。 非 监督 学 习 最 常用 的 
情形 是 分 类 ， 例 如 一 个 孩子 见 过 许多 猫 和 狗 后 ， 如 果 大 人 不 告诉 孩子 
这 两 种 动物 的 名 字 ， 孩 子 也许 不 知道 名 字 ， 但 慢 慢 会 知道 猫 和 狗 是 两 
种 不 同 的 动物 。 在 商业 上 有 很 多 应 用 ， 例 如 在 营销 上 面 可 以 根据 人 群 
的 不 同属 性 将 其 划分 成 不 同人 群 进行 精准 营销 ， 在 社交 媒体 上 面 ， 可 
以 根据 人 们 之 间 的 互动 次 数 ， 划 出 每 个 人 的 朋友 背 子 ， 在 医疗 诊断 上 


面 可 以 根据 不 同 症状 之 间 的 相关 性 更 精确 地 预测 还 未 发 现 的 疾病 ; 等 


有 
等 。 


增 量 学 习 和 连续 学 习 


目前 的 机 器 学 习 算 法 都 是 “离线 训练 ”， 先 用 一 大 堆 数 据 训 练 模 
型 ， 训 练 完 测试 好 就 拿 去 做 识别 用 ， 在 识别 过 程 中 ， 这 个 模型 是 固定 
的 。 如 果 发 现 了 新 的 情况 ， 有 了 新 的 训练 数据 ， 就 要 把 新 数据 和 原来 
的 老 数 据 合 在 一 起 重新 训练 这 个 模型 ， 训 练 完 还 要 重新 测试 才能 使 
用 。 许 多 互联 网 巨头 每 个 月 都 要 训练 几 十 万 个 模型 ， 目 前 的 计算 量 主 
要 在 训练 上 。 增 量 学 习 就 是 当 有 新 数据 时 ， 只 用 新 数据 训练 原来 的 模 
型 ， 使 机 器 在 原 有 的 识别 功能 之 上 增加 新 的 识别 功能 。 连 续 学 习 就 是 
能 够 边 识别 边 学 习 。 这 两 种 学 习 算 法 都 还 在 研究 的 早期 阶段 。 


生成 对 抗 网 络 


监督 学 习 的 最 大 问题 之 一 就 是 需要 大 量 人 工 标 注 的 数据 。 在 很 多 
情况 下 ， 要 么 没有 数据 ， 要 么 标注 的 工作 量 太 大 。 生 成 对 抗 网 络 
(Generative Adversarial Network，GAN) 解决 了 这 个 问题 。 因 此 
GAN 成 为 目前 最 炙手可热 的 非 监 督学 习 算 法 之 一 。 


GAN 减 少 深度 学 习 训 练 所 需 的 数据 量 的 方法 是 :从 少量 的 已 有 数据 
出 发 去 创造 出 更 多 的 新 的 标注 数据 一 一 多 数 情 况 下 是 图 像 数 据 。 

图 3. 13 是 GAN 的 示意 图 ， 图 中 有 两 个 深度 神经 网 络 : G 和 D， 其 中 6 
是 生成 网 络 ，D 是 鉴别 网 络 。 生 成 网 络 的 任务 是 根据 一 组 真实 、 有 限 的 
数据 《例如 一 组 图 片 ) 生成 更 多 类 似 但 不 同 的 数据 。 然 后 把 这 些 生 成 
的 数据 和 真实 数据 混在 一 起 喂 给 鉴别 网 络 。 鉴 别 网 络 的 任务 是 使 用 很 
少 的 真实 数据 训练 后 ， 分 出 哪些 是 真实 数据 哪些 是 生成 数据 。 如 果 生 


成 网 络 生成 的 数据 能 个 鉴 别 网 络 认 出 来 不 是 真实 数据 ， 束 说 明生 成 网 
络 模仿 得 不 够 真实 ， 需 要 继续 调整 网 络 参数 ， 目 的 是 让 鉴别 网 络 分 不 
出 来 。 如 末 鉴 别 网 络 分 不 出 来 真 假 ， 就 说 明 鉴别 网 络 不 够 好 ， 需 要 继 
续 调 整 参 数 分 出 真 念 。 这 样 “ 道 高 一 矿 ， 魔 高 一 丈 ” 地 持续 对 抗 下 
去 ， 两 个 网 络 就 越 来 越 好 : 生成 网 络 模仿 得 越 来 越 真 ， 鉴 别 网 络 越 来 
越 “ 火 眼 金 睛 ”。 当 两 个 网 络 打 得 难 解难 分 时 ， 生 成 网 络 生 成 出 来 的 
数据 就 和 真实 数据 无 法 分 辨 。 当 缺乏 足够 多 的 真实 数据 时 这 些 生成 数 
据 就 可 以 用 于 神经 网 络 的 训练 了 。 


真实 


) 深 
ho m> 


噪音 


图 3.13 生 成 对 抗 网 络 


可 以 把 这 个 过 程 想 象 为 一 个 警察 和 假币 伪造 者 之 间 的 比拼 ， 伪 造 
者 想 把 假币 做 得 像 真 的 ， 警 察 硕 望 看 到 任何 钞票 时 都 能 鉴别 出 真 伪 。 
两 个 对 抗 网 络 也 在 彼此 学 习 ， 也 就 是 说 ， 当 一 个 网 络 努 力 去 鉴别 假币 
时 ， 男 一 个 网 络 束 能 把 假币 做 得 越 来 越 真 。 


男 一 个 例子 是 生成 对 抗 网 络 可 以 模仿 名 画 。 经 过 训练 之 后 的 最 终 
结果 是 ， 一 个 网 络 可 以 像 凡 。 高 、 毕 加 索 一 样 作画 ， 另 一 个 网 络 能 以 


你 闻所未闻 的 洞察 力 鉴 别 画作 。 这 对 于 医疗 等 领域 来 说 非常 重要 ， 在 
这 些 领域 中 ， 由 于 隐私 的 需要 ， 可 用 的 数据 非常 有 限 。GAN 可 以 填补 缺 
失 的 数据 ， 自 行 制作 完全 “ 腾 造 ”的 病 患 数据 ， 而 这 些 数 据 在 用 于 训 
练 AI 时 和 真实 数据 同样 有 效 。 深 度 生 成 模型 有 广泛 的 应 用 ， 包 括 密度 
估计 、 疼 像 降 品 《〈 从 低 分 辩 率 或 高 品 音 的 图 像 中 生成 高 品质 图 像 ) 、 
图 像 修复 (从 部 分 残缺 的 图 像 中 恢复 完整 图 像 》、 数 据 压缩 、 场 景 理 
解 、 表 征 学 习 、3D 场 景 搭建 、 半 监督 分 类 或 分 级 控制 等 。 


相 比 判别 模型 “例如 CNN) ， 生 成 模型 更 厉害 的 原因 如 下 : 


(1) 能 够 从 数据 中 识别 并 表现 出 隐藏 的 结构 ， 例 如 三 维 物体 的 旋 
转 、 光 强 、 亮 度 或 形状 等 概念 。 


(2) 能 够 想象 世界 “可 以 是 什么 样 ”， 而 不 是 仅仅 展现 世界 “已 
经 是 什么 样 ”。 


(3) 通过 拟 合 并 生成 近似 真实 的 场景 ， 可 以 预见 未 来 。 


迁移 学 习 的 一 个 例子 是 当 一 个 神经 网 络 学 会 了 中 文 翻译 成 日 文 ， 
再 让 它 学 德 文 翻译 成 英文 时 就 比 从 头 训练 要 人 花 的 时 间 少 得 多 。 这 里 面 
的 道理 在 于 语言 的 结构 有 很 多 相似 的 地 方 ， 一 旦 掌握 了 这 些 结构 ， 学 
习 下 一 个 束 快 了 这 和 人 的 技能 学 习 类 似 。 可 以 想象 ， 只 要 两 种 任务 
的 结构 有 相似 之 处 ， 束 可 以 用 迁移 学 习 的 方法 。 


学 习 如 何 学 习 


学 习 如 何 学 习 也 叫 “ 元 学 习 ”。 目 前 所 有 的 神经 网 络 都 是 为 了 一 
个 单一 任务 而 被 设计 和 训练 的 。 换 一 个 不 同 的 任务 ， 例 如 从 识别 图 片 
换 成 学 下 棋 ， 原 来 的 机 器 就 完全 不 工作 了 。 目 前 的 所 谓 “ 元 学 习 ” 并 


非 让 机 髓 和 人 一 样 擎 握 举 一 反 三 的 能 力 ， 而 是 让 同一 个 机 口 适应 更 多 
种 类 的 工作 。 一 个 办 法 是 训练 时 用 多 个 种 类 的 任务 来 训练 。 奶 一 个 办 
法 是 把 机 器 分 为 两 个 层次 : 学 习 任 务 的 机 器 和 观察 学 习 过 程 的 机 器 。 
如 果 后 者 能 够 领悟 出 不 同 任务 之 间 的 相关 性 ， 束 可 以 更 快 地 学 习 新 任 
务 。 

神经 网 络 可 以 有 许多 不 同 的 结构 ， 例 如 不 同 的 层 数 、 不 同 的 连接 
方式 ， 等 等 。 把 这 些 结构 看 成 一 个 可 能 的 空间 ， 让 机 器 上 自己 在 这 个 空 
间 中 寻找 对 给 定 问 题 的 最 佳 结构 。 


深度 学 习 的 局 限 性 


上 面 介 绍 了 一 些 目前 最 热 的 神经 网 络 ， 例 如 卷 积 神经 网 络 、 循 环 
神经 网 络 、 强 化 学 习 、 生 成 对 抗 网 络 等 ， 它 们 有 很 多 神奇 的 地 方 ， 在 
实际 中 也 得 到 了 相当 广泛 的 应 用 。 但 神经 网 络 也 好 ， 深 度 学 习 也 好 ， 
都 不 是 万 能 的 ， 它 们 有 其 自身 的 局 限 性 。 


神经 网 络 的 一 个 局 限 性 是 ， 需 要 依赖 特定 领域 的 先 验 知识 ， 也 区 
是 需要 特定 场景 下 的 训练 ， 说 白 了 就 是 神经 网 络 只 会 教 什 么 学 什么 ， 
不 会 举一反三 。 神 经 网 络 的 这 个 局 限 性 ， 是 因为 神经 网 络 的 学 习 本 质 
上 残 是 对 相关 性 的 记忆 ， 也 束 是 说 神经 网 络 将 训练 数据 中 相关 性 最 局 
的 因素 作为 判断 标准 。 打 比方 说 ， 如 果 一 直 用 各 个 品种 的 白色 狗 来 训 
练 神经 网 络 ， 让 它 学 会 “这 是 狗 ” 的 判断 ， 神 经 网 络 会 发 现 这 些 狗 最 
大 的 相关 性 就 是 白色 ， 从 而 得 出 结论 : 日 色 = 狗 。 在 这 种 情况 下 ， 让 这 
个 神经 网 络 看 见 一 只 白 猫 ， 甚 至 一 只 白 免 子 ， 它 仍然 会 判断 为 狗 。 机 
器 学 习 的 这 种 采 板 行为 ， 用 专业 术语 描述 叫 “ 过 度 拟 合 ”。 如 果 想 让 
神经 网 络 变 得 更 聪明 ， 就 必须 用 各 种 颜色 、 各 个 品种 、 是 否 罕 衣服 等 
各 种 场景 下 的 狗 来 训练 神经 网 络 ， 如 此 它 才 有 可 能 发 现 不 同 的 狗 之 间 


更 多 的 相关 性 ， 从 而 识别 出 更 多 的 狗 。 人 类 则 不 同 ， 一 个 两 三 岁 智力 
发 育 正常 的 孩子 ， 在 看 过 几 只 狗 之 后 ， 就 能 认 出 这 世上 几乎 所 有 的 狗 
了 。 无 须 大 量 标注 数据 和 特殊 场景 的 训练 ， 只 需要 少量 的 数据 ， 人 脑 
就 可 以 自己 想 清楚 这 个 过 程 。 在 这 方面 ， 目 前 的 神经 网 络 和 人 脑 相 
比 ， 还 有 很 大 的 差距 。 

再 如 前 面 提 到 的 汽车 和 猫 的 例子 ， 如 宁 一 直 用 正和 贡 的 汽车 来 训练 
这 个 神经 网 络 ， 那 么 当 神 经 网 络 突然 看 到 图 3. 14 的 时 候 ， 很 有 可 能 无 
法 把 它 认 作 汽车 ， 而 觉得 它 更 像 猫 。 

这 个 问题 在 自动 驾驶 领域 显得 尤为 突出 ， 由 于 道路 交通 状况 的 复 
杂 性 ， 各 种 交通 指示 标志 的 多 样 性 ， 想 把 所 有 的 道路 交通 场景 都 训练 
到 显然 是 不 可 能 的 。2016 年 特 斯 拉 第 一 起 目 动 区 驶 致死 的 事故 也 和 这 
个 原因 有 关 。 


图 3.14 机 器 学 习 会 把 这 辆 汽车 当成 猫 


神经 网 络 的 另 一 个 局 限 性 是 无 法 解释 结果 为 什么 是 这 样 ， 因 为 人 
类 无 法 理解 暗 知识 ， 所 以 更 无 法 解释 。 对 于 神经 网 络 这 个 “ 满 是 旋钮 
的 黑 盒 子 ”， 每 个 旋钮 为 什么 旋转 到 那个 位 置 ， 而 不 是 多 一 点 或 者 少 
一 点 ， 都 是 无 法 解释 的 。 这 个 不 可 解释 性 在 许多 涉及 安全 和 公共 政策 
的 领域 都 是 很 大 的 问题 。 例 如 ， 医 疗 涉及 人 的 健康 和 生命 ， 医 生 的 诊 
盯 需 要 根据 极为 严谨 的 医学 逻辑 ， 因 此 医疗 对 于 人 工 智能 的 可 解释 性 
要 求 远 高 于 其 他 行业 ， 极 少 有 医院 或 医生 敢 把 无 法 解释 的 诊断 结果 用 
在 患者 里 上。 然而 由 于 神经 网 络 自身 不 具备 医学 逻辑 ， 其 输出 的 结果 


也 缺乏 医学 上 的 解释 性 ， 因 此 目前 人 工 乔 能 在 医学 上 的 应 用 ， 无 论 是 
影像 识别 还 是 辅助 诊断 ， 都 需要 专业 医生 的 复核 ， 距 离 取 代 医 生还 有 
较 大 的 距离 。 

人 工 智 能 之 所 以 有 上 述 两 个 局 限 性 ， 主 要 是 因为 目前 的 神经 网 络 
只 有 相关 性 的 学 习 能 力 ， 没 有 因果 推理 能 力 ， 更 无 法 把 一 步 一 步 推理 
的 过 程 表 现 出 来 。 因 此 ， 想 要 克服 这 两 个 局 限 性 ， 我 们 需要 有 因果 推 
理 能 力 的 人 工 知 能。 要 实现 这 件 事 情 ， 人 工 智 能 需要 做 的 ， 不 仅 是 识 
别 场景 ， 还 需要 将 识别 出 来 的 场景 和 它 具 体 的 功能 以 及 想 做 的 事情 结 
合 起 来 ， 从 而 实现 合理 的 迎 辑 推理 。 


证 我 们 看 看 人 脑 是 如 何 理解 一 个 场景 的 。 当 人 进入 一 个 新 的 房间 
时 ， 会 很 目 然 地 对 这 个 房间 的 大 小 ， 里 面 各 个 物品 的 大 小 、 位 置 等 有 
一 个 大 致 的 认识 。 之 后 ， 人 脑 会 把 识别 出 的 场景 和 物品 ， 与 其 功能 一 
一 匹配 ， 例 如 ， 床 是 用 来 册 的 ， 而 且 是 一 张 双 人 床 可 以 庙 两 个 人 ， 椅 
子 是 用 来 坐 的 ， 杯 子 是 用 来 喝 水 的 ， 等 等 。 然 而 值得 注意 的 是 ， 上 述 
的 几何 重建 和 功能 推理 ， 其 精度 是 和 具体 任务 相 结合 的 。 例 如 ， 人 一 
开始 看 到 杯子 ， 会 匹配 它 喝 水 的 功能 ， 并 看 到 它 放 在 桌子 上 ， 判 断 距 
离 目 己 两 三 米 远 ， 这 个 距离 判断 是 非常 不 精确 的 。 然 而 当 人 真 的 需要 
喝 水 时 ， 喝 水 成 为 一 个 任务 ， 人 在 走 过 去 拿 杯子 的 过 程 中 ， 不 断 地 、 
更 加 精确 地 判断 自己 和 杯子 的 距离 ， 直 到 非常 精确 地 拿 到 杯子 。 这 个 
过 程 就 是 一 个 典型 的 任务 驱动 的 场景 识别 和 功能 推理 。 

此 外 ， 人 类 对 于 功能 的 推理 ， 并 非 会 拘泥 于 具体 的 物体 ， 而 是 能 
抽象 出 这 个 物体 和 功能 有 关 的 物理 特性 ， 从 而 匹配 其 功能 。 仍 然 以 喝 
水 为 例 ， 如 宁 房 间 里 没有 杯子 ， 但 是 有 一 个 味 、 一 个 盘子 、 一 根 拓 面 
杖 ， 人 会 很 自然 地 选择 对 作为 喝 水 的 工具 【如果 连 对 都 没有 则 可 能 
择 盘 子 ) ， 因 为 殊 可 以 作为 容 絮 的 物理 特点 和 杯子 是 一 至 的。 而 且 ， 
选择 了 亚 之 后 ， 人 拿 球 的 动作 ， 喝 水 的 动作 ， 都 会 和 拿 杯 子 不 一 样 ， 
这 同样 是 由 杯子 和 吐 不 同 的 物理 特性 决定 的 。 由 此 可 见 ， 人 对 于 物体 
的 功能 推理 ， 是 会 根据 任务 的 要 求 ， 抽 象 其 物理 特性 ， 从 而 推理 它 的 


功能 并 完成 任务 ， 因 此 人 工 智 能 的 场景 识别 和 功能 匹配 ， 是 需要 基于 
场景 和 物体 的 物理 特性 来 完成 的 ， 而 不 仅仅 是 识别 和 标定 具体 功能 。 

这 种 基于 任务 驱动 的 因果 推理 和 当前 的 神经 网 络 的 对 比如 下 。 
( 见 表 3. 1) 


表 3.1 神 经 网 络 和 任务 驱动 的 对 比 


I | 神经 网 络 任务 驱动 


识别 物体 是 什么 识别 物体 的 物理 特性 

如 果 没 训练 过 ， 就 无 法 识别 即使 没 训练 过 ， 也 可 以 识别 
通过 标定 和 训练 匹配 功能 通过 物体 特性 匹配 功能 

如 果 没 训练 过 ， 就 无 法 匹配 即使 没 训练 过 ， 也 能 匹配 功能 


物体 识别 


数据 标定 驱动 任务 驱动 


需要 大 量 数据 训练 


有 推理 能 


资料 来 源 : 朱 松 纯 ，《 正 本 清 源 》，2016 年 11 月 刊登 于 《视觉 求索 》。 
目前 在 这 个 方面 探索 的 代表 人 物 是 加 州 大 学 洛杉矶 校区 (UCLA) 

的 图 灵 奖 获得 者 朱 迪 亚 。， 珀 尔 (Judea Pearl) 教授 以 及 他 的 同事 朱 松 
纯 教 授 。 他 们 认为 可 以 建立 一 个 基于 常识 之 上 的 “概率 决策 图 ”， 也 
叫 “ 概 率 语 法 图 ”。 这 个 模型 把 人 类 的 常识 和 世界 模型 都 包含 进来 ， 
又 采用 贝 叶 斯 原理 ， 可 以 像 人 类 一 样 不 需要 许多 数据 就 能 学 会 ， 在 处 
理 许多 问题 上 效率 远 高 于 神经 网 络 。 在 高 科技 领域 ， 健 谷 一 家 由 斯 坦 
福 大 学 教授 威 德 罗 的 弟子 创办 的 人 工 智 能 公司 Vicarious 得 到 了 和 著名 风 
险 投资 人 带 尔 (Peter Thiel) 、 特 斯 拉 创 始 人 号 斯 元 、 脸 书 创始 人 扎 
元 伯 格 (Mark Zuckberg) 和 亚马逊 创始 人 贝 佐 斯 (Jeff Bezos) 的 投 
资 。 他 们 也 是 采用 了 概率 决策 图 的 方法 。 虽 然 目 前 他 们 是 少数 派 ， 但 


也 许 若干 年 后 会 异军突起 ， 就 像 神经 网 络 坐 了 50 年 “ 冷 板 使 ”今天 突 
然 一 飞 冲天 一 样 。 


第 四 章 
逐鹿 硅谷 一 一 AI 产业 争霸 战 


这 一 章 不 谈 理论 和 技术 ， 只 谈 Al 的 产业 生态 。 对 于 想 抓 住 Al 
时 代 投 资 机 会 的 人 ， 这 章 提 供 了 对 Al 产业 和 商业 的 一 个 基础 理 
解 。 没 有 读 过 前 面 章节 的 读者 也 可 以 直接 读 这 一 章 。 


最 新 技术 巳 浪 


人 工 智 能 晕 无 疑问 是 继 移动 互联 网 之 后 的 一 次 超级 大 浪 ， 其 规模 
和 影响 至 少 是 互联 网 级 别 的 。 这 次 创新 大 浪 启 动 的 标志 性 事件 是 2012 
年 的 ImageNet 比 赛 。ImageNet 目 前 有 1 400 万 张 图 片 ， 其 中 上 百 万 张 有 
文字 标注 。 标 注 的 文字 通常 是 用 短语 描述 该 图 片 的 内 容 〈 例 如 “草地 
上 卧 着 的 一 条 黄 狗 ”) 。ImageNet 的 比赛 主要 是 看 谁 的 程序 能 够 最 准 
确 地 识别 出 图 片 的 内 容 。 在 2012 年 以 前 ， 识 别 主要 是 人 工 选 择 物体 特 
征 并 且 写 出 识别 这 些 特 征 的 程序 ， 准 确 率 的 最 高 水 平一 直 在 74% 左 右 徘 


徊 。2012 年 ， 亚 历 克 斯 。 殉 里 捷 夫 斯 基 使 用 多 层 神 经 网 络 AlexNet 一 举 
把 识别 率 提高 了 10 个 百分点 ， 达 到 84%。 


这 个 突破 性 结果 立即 引起 了 产业 界 的 强烈 兴趣 和 关注 。 谷 歌 大 脑 
的 负责 人 杰 夫 。 迪 恩 (Jeff Dean) 敏锐 地 发 现 了 这 个 重大 机 遇 ， 他 用 
了 一 年 的 时 间 说 服 了 谷歌 当时 的 CE0《〈 首 席 执 行 官 ) 兼 创始 人 拉 里 。 佩 
奇 (Larry Page) ， 开 始 全 公司 大 举 转 型 AI， 随 后 Facebook、 和 微软、 
百度 等 科技 巨头 纷纷 跟 进 。 如 图 4. 1 所 示 ， 在 今后 几 年 ， 神 经 网 络 不 断 
提高 识别 的 准确 率 ， 终 于 在 2015 年 达到 96% 的 准确 率 ， 超 过 了 人 类 所 能 
达到 的 95%。 这 些 突破 证 明了 机 器 学 习 可 以 开始 解决 实际 问题 ， 也 让 工 
业界 认识 到 了 巨大 的 商业 潜力 。 但 这 个 突破 来 之 不 易 ，AI 走 过 了 60 年 
的 艰 洱 道路 。 


96% 
尖 训 别 |; 侍 确 谈 
人 类 识别 准确 率 本 
SR 88% 
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图 4.1 2010 一 2015 年 ImageNet 大 赛 历年 识别 准确 率 
图 片 来 源 : http://yann. lecun. com/。 


AI 突破 三 要 又 


AI 发 展 了 60 年 ， 为 什么 到 今天 能 够 突破 ? 这 是 由 于 长 期 积累 的 三 
个 条 件 成 熟 了 。 


第 一 个 条 件 是 计算 能 力 。 计 算 能 力 和 半导体 的 集成 度 ( 在 单位 半 
导体 材料 面积 上 可 以 集成 的 晶体 管 的 数量 ) 直接 相关 。 从 第 一 个 集成 
电路 晶体 管 诞 生 以 来 ， 在 过 去 的 50 年 中 ， 半 导体 的 集成 度 的 增加 速度 
基本 遵循 “摩尔 定律 ”。1965 年 4 月 19 日 ，《 电 子 学 》 和 杂志 
(Blectronics) 发 表 了 仙 童 半导体 公司 工程 师 戈 登 。 摩 尔 〈Gordon 
Moore， 后 成 为 英特尔 的 创始 人 之 一 ) 撰写 的 文章 《让 集成 电路 填 满 更 
多 的 组 件 》， 文 中 预言 半导体 芯片 上 集成 的 晶体 管 和 电阻 数量 将 每 年 
增加 一 倍 。1975 年 ， 摩 尔 在 IEEE ( 电 况 和 电子 工程 师 协 会 ) 国际 电子 
组 件 大 会 上 提交 了 一 篇 论文 ， 根据 当 时 的 实际 情况 对 摩尔 定律 进行 了 
修正 ， 把 “每 年 增加 一 倍 ” 改 为 “每 两 年 增加 一 倍 ”， 而 这 个 定律 经 
过 传播 演化 ， 变 成 今天 普遍 流行 的 说 法 “计算 机 运算 速度 每 18 个 月 提 
升 一 倍 ， 价 格 每 18 个 月 下 降 一 半 ”。1970 年 一 个 芯片 上 的 晶体 管 数量 
约 为 1 000 个 ， 今 天 一 个 忌 片 上 的 晶体 管 数量 达 到 100 亿 个 ， 不 到 50 年 
中 提高 了 1 000 万 倍 。 相 应 地 ， 计 算 能 力也 提高 了 1 000 万 倍 。 目 前 虽 
然 单个 蕊 片 的 晶体 管 数 量 增加 速度 放 绥 ， 但 人 们 开始 把 成 百 上 干 个 蕊 
片 封 装 在 一 起 以 便 提 高 总 的 计算 速度 。 

计算 能 力 对 人 工 智 能 的 巨大 推动 还 体现 在 一 个 标志 性 事件 上 一 一 
GPU【〔 图 形 处 理 器 ， 被 用 于 训练 AI 算 法 。2009 年 ， 斯 坦 福 大 学 计算 机 系 
教授 吴 恩 达 和 他 的 博士 生 拉 加 特 。 蓝 恩 纳 (Rajat Raina) 第 一 次 提出 
由 于 神经 网 络 中 大 量 计算 可 以 并 行 ， 用 一 个 GPU 可 以 比 双核 CPU 快 70 
倍 ， 原 来 需要 几 周 完成 的 计算 一 天 就 可 以 完成 。 之 后 纽约 大 学 、 多 伦 
多 大 学 及 瑞士 人 工 智 能 实验 室 纷 纷 在 GPU 上 加 速 其 深度 神经 网 络 。 赢 得 
2012 年 InageNet 竞 赛 的 AlexNet 同 样 用 的 也 是 GPU。 从 此 之 后 ，GPU 惑 在 


神经 网 络 的 训练 和 识别 中 树立 了 公认 的 王者 地 位 。 再 到 后 来 AlphaGo 发 
威 战胜 人 类 顶级 围棋 手 ， 背 后 则 是 谷歌 自行 研发 的 专 为 深度 学 习 使 用 
的 TPU 发 挥 了 重要 支撑 ， 每 个 TPU 可 以 提供 10 倍 于 GPU 的 计算 能 力 。 在 本 
章 中 将 会 详细 分 析 为 什么 TPU 比 GPU 快 。 

第 二 个 条 件 是 数据 。 如 果 说 算法 是 火箭 发 动机 ， 那 么 数据 就 是 燃 
料 。 由 于 互联 网 的 发 展 和 各 类 传感器 (例如 在 各 种 环境 中 的 温度 、 位 
置 、 压 力 等 物理 化 学 变量 的 测量 ， 社 会 中 大 量 摄像 头 的 存在 ) 成 本 的 
大 幅 下 降 和 广泛 安装 ， 根 据 IDC (互联 网 数据 中 心 ) 的 监测 统计 ，2011 
年 全 球 数 据 总 量 已 经 达到 1. 8ZB (17B=1 万 亿 6B) ， 相 当 于 18 亿 个 1TB 的 
移动 硬盘 ， 而 这 个 数值 还 在 以 每 两 年 翻 一 番 的 速度 增长 ， 预 计 到 2020 
年 全 球 将 总 共 拥 有 35ZB 的 数据 量 ， 增 长 近 20 倍 。 


这 比 从 人 类 出 现 到 计算 机 出 现 前 产生 的 所 有 数据 都 多 。 以 目前 的 
传感器 技术 发 展 速度 ， 和 若干 年 后 回头 看 今天 的 数据 量 ， 不 仅 量 小 而 且 
数据 采集 的 密度 和 广度 都 远 远 不 够 。 

第 三 个 条 件 就 是 那 批 甘 愿 坐 “ 冷 板 合 ”的 科学 家 经 过 了 几 十 年 的 
只 累 ， 终 于 从 2006 年 开始 在 算法 上 有 了 重大 突破 。 当 时 在 多 伦 多 大 学 
任教 的 辛 顿 教授 在 美国 《科学 》 杂 志和 相关 的 期 刊 上 发 表 了 论文 ， 证 
明了 深度 神经 网 络 的 能 力 和 实用 性 。 从 此 ， 基 于 多 层 神经 网 络 的 深度 
学 习 理 论 成 为 本 轮 人 工 智 能 发 展 的 重要 推动 力 ， 相 当 于 过 去 飞机 从 达 
* 芬 奇 设计 的 启运 膀 的 飞行 器 变 成 有 螺旋 桨 的 发 动机 ， 人 工 智 能 的 概 
念 和 应 用 开始 一 路 攀升 ， 语 音 识 别 、 机 器 视觉 技术 在 几 年 间 便 超过 了 
太 关 的 水 于 

正 是 算 力 、 数 据 、 算 法 这 三 个 要 素 同 步 成 熟 ， 形 成 合力 ， 终 于 带 
来 了 今天 AI 的 爆发 。 这 三 个 要 素 中 最 重要 的 是 计算 能 力 的 发 展 和 算法 
的 互相 促进 。 


金字 塔 形 的 产业 绪 检 


一 个 产业 的 生态 主要 是 指 这 个 产业 有 哪些 环节 和 这 些 环节 之 间 的 
关系 ， 例 如 哪个 环节 是 生态 的 瓶颈 并 掌握 最 强 的 砍 价 能 力 。 更 深入 的 
产业 生态 分 析 还 包括 各 个 环节 的 未 来 发 展 以 及 对 整个 生态 的 影响 。AI 
的 产业 生态 如 图 4. 2 所 示 ， 是 一 个 金字 塔 形 的 结构 。 


技术 门槛 高 ， 适 用 
广 ， 学 术 界 为 主 


研发 成 本 高 ， 风 险 
大 ,垄断 性 强 


dT 
> 图 像 识别 | 语言 文字 ws 
图 4.2Al 产 业 生 态 的 金字 塔 形 结构 
金字 塔 的 下 层 对 上 层 有 依赖 性 ， 但 反之 不 成 立 。 也 就 是 说 上 层 是 


先行 优势 ， 快 速 迭代 ， 
数据 独占 ， 跨 行 合作 
淮 赢 : 行内 ? 行 外 》 
驱动 力 ， 是 上 自 变 量 ， 下 层 是 驱动 结果 ， 是 因 变 量 。 人 金字 搭 的 宽度 大 致 
对 应 市 场 规模 和 公司 的 数量 。 所 以 越 上 层 对 整个 行业 的 影响 越 大 但 市 
场 规模 越 小 ， 越 下 层 市 场 规模 越 大 但 影响 越 小 。 


产业 的 星 冠 : 算法 


我 们 前 面 说 过 ，AI 近 年 的 突破 性 发 展 的 三 个 驱动 因素 之 一 是 神经 
网 络 算法 的 突破 。 其 实 这 是 三 个 因 系 中 最 重要 的 因 系 ， 因 为 其 他 两 个 
因 系 (计算 能 力 和 数据 量 ) 属于 “搭便 车 ”。 目 前 研究 算法 主要 集中 


在 美国 的 一 流 大 学 和 几 家 超级 互联 网 公司 〈 谷 歌 、Facebook、 亚 马 
了 还、 微软 、IBM、 百 度 等 )。 大 学 的 算法 研究 大 部 分 都 是 学 术 性 和 公开 
的 ， 而 大 公司 的 算法 研究 最 核心 的 只 留 给 自己 用 。 专 门 研究 算法 的 私 
人 企业 屈指 可 数 ， 一 家 著名 的 算法 公司 就 是 被 谷歌 收购 的 大 胜 围 棋 世 
界 冠 军 的 DeepMind。 另 一 家 是 由 硅谷 老将 ， 兽 经 做 出 世界 上 第 一 台 掌 
上 电脑 PalmPilot 的 杰 夫 。 和 霍金 斯 〈Jeff Hawkins ) 创办 的 
Numenta (公司 名 来 自 拉 丁 文 mentis， 意 为 “心灵 ”) 。Numenta 是 一 
个 由 私人 资助 的 研究 所 ， 他 们 过 去 十 几 年 专注 于 发 展 一 种 叫 作 层 级 时 
序 记 忆 (Hierarchical Temporal Memory，HIM) 的 算法 。 这 种 算法 受 
大 脑 新 皮质 中 锥 体 细胞 的 启发 ， 网 络 结构 远 比 各 种 神经 网 络 复杂 。 这 
种 算法 的 一 个 特点 是 可 以 连续 学 习 。 神 经 网 络 都 有 一 个 缺陷 ， 在 模型 
训练 完毕 后 ， 如 果 有 新 数据 可 以 用 ， 束 必须 把 新 数据 和 原来 的 老 数 据 
合并 在 一 起 重新 训练 模型 。 而 HTM 的 连续 学 习 没 有 这 个 缺陷 ， 当 新 数据 
来 了 以 后 ， 只 要 继续 把 新 数据 喂 给 模型 即 可 。HIM 的 第 二 个 优势 在 于 可 
以 将 物理 世界 的 基本 种 识 融入 模型 。Numenta 并 不 寻求 直接 提供 商业 解 
决 方案 ， 而 是 仪 仅 提供 算法 的 许可 ， 让 合作 伙伴 用 自己 的 算法 来 解决 
商业 问题 。Numenta 还 提供 了 开源 的 平台 ， 让 更 多 的 开发 者 在 这 个 平台 
上 完善 HIM 算 法 。 从 Numenta 出 来 创业 的 威 德 罗 教授 的 博士 生 迪 利 普 。 
乔治 (Dileep George) 基于 HTM 创 办 了 一 家 做 机 械 手 通用 软件 的 公司 
Vicarious。 相 对 于 应 用 ， 纯 粹 做 算法 的 公司 少 得 可 怜 ， 原 因 主 要 是 缺 
乏 了 商业 模式 。 


技术 制 高 尽 : 心 片 


半导体 必 片 是 一 切 信息 撤 术 的 基础 ， 有 了 芯片 才 有 电脑 和 存储 ， 
有 了 电脑 和 存储 才 有 互联 网 ， 有 了 互联 网 才 有 大 数据 ， 有 了 大 数据 才 
有 人 工 智 能 。 在 这 每 一 波 的 发 展 中 ， 臣 片 都 是 最 关键 的 环节 ， 攻 方太 


商 总 是 处 在 霸主 地 位 。 在 大 型 机 时 代 ， 能 够 自己 开发 芯片 的 IBM 独 占 鳌 
头 。 在 个 人 电脑 时 代 ， 能 够 生产 出 最 好 的 CPU 的 英特尔 成 为 新 的 霸主 。 
在 移动 通信 时 代 ， 高 通 〈Qualcomm) 几乎 克 断 了 手机 人 芯片， 直接 挑战 
英特尔 的 霸主 地 位 。 在 云 计 算 大 数据 时 代 ， 三 星 〈Samsung) 凭借 自己 
在 存储 芯片 方面 的 优势 成 为 世界 半导体 第 一 大 三 家 。 在 人 工 智 能 时 
代 ， 谁 将 是 新 的 霸主 ? 

这 个 新 霸主 的 桂冠 很 可 能 落 在 硅谷 的 半导体 公司 英 伟 达 
(Nvidia) 头 上 。 英 伟 达 成 立 于 1993 年 ， 创 始 人 是 出 生 于 中 国 台 湾 ， 
小 时 候 随 父母 来 到 美国 的 斯 坦 福 大 学 毕业 生 黄 仁 勋 (Jen-sen 
Huang) 。 公 司 最 初 是 做 电脑 图 形 显 示 卡 ，20 多 年 来 一 直 在 研发 销售 图 
形 显 卡 和 图 形 处 理 芯片 GPU。 除 了 工业 应 用 之 外 ， 图 形 显卡 的 最 大 市 场 
是 电脑 游戏 ， 今 天 高 端 电脑 游戏 里 面 几 乎 清一色 用 英 伟 达 的 显卡 。 当 
电脑 游戏 市 场 开 始 成 熟 后 ， 英 伟 达 也 曾经 想 进 入 手机 市 场 并 收购 过 相 
应 的 公司 ， 但 是 并 不 成 功 。 直 到 2012 年 上 天 为 准备 好 了 的 英 伟 达 掉 下 
一 块 “ 大 馅 饼 ”， 这 个 馅 饼 就 是 我 们 前 面 提 到 过 的 2012 年 的 ImageNet 
比赛 。 在 这 个 比赛 中 取得 突破 的 AlexNet 的 发 明 人 亚 历 克 斯 就 使 用 了 英 
伟 达 的 GPU， 证 明了 GPU 非常 适合 用 于 有 许多 并 行 计 算 的 神经 网 络 ， 比 
CPU 快 得 多 。 在 这 之 后 的 几 年 ， 其 他 人 都 开始 采用 GPU， 比 谁 能 将 网 络 
做 得 更 大 ， 层 数 更 多 。 从 此 以 后 ，GPU 成 了 神经 网 络 计算 的 引擎 ， 相 当 
于 CPU 对 电脑 的 作用 一 样 。 

为 什么 GPU 会 成 为 神经 网 络 计 算 的 引擎 ? 训练 神经 网 络 就 相当 于 调 
黑 盒子 上 的 旋钮 ， 调 旋钮 是 通过 数学 的 算法 调 的 ， 这 些 旋 钮 动 辑 几 十 
亿 个 ， 需 要 大 量 的 计算 。 传 统 电 脑 用 的 是 CPU， 用 CPU 去 调 旋钮 相当 于 
调 完 第 一 个 再 调 第 二 个 ， 一 个 一 个 按 顺 序 来 ， 虽 然 现 在 CPU 很 快 ， 但 神 
经 网 络 的 旋钮 实在 太 多 了 ， 连 CPU 都 招架 不 住 了 ， 这 时 候 GPU 就 出 现 
Ei 


GPU 和 CPU 不 一 样 的 地 方 是 它 一 次 可 以 同时 调 成 千 上 万 个 旋钮 ， 原 
来 CPU 几 年 才能 调 完 的 活 GPU 几 天 就 干 完了 〈 有 兴趣 的 读者 可 以 看 附录 3 


中 关于 GPU 的 技术 描述 ) 。GPU 的 出 现 ， 让 神经 网 络 可 以 更 大 ， 因 而 处 
理 能 力 更 强 ， 从 一 个 纯 学 术 的 研究 项 目 变 为 有 巨大 商业 价值 的 工具 。 

深度 学 习 需 要 用 GPU 的 主要 有 两 类 : 模型 训练 和 识别 。 前 者 不 光 要 
处 理 大 量 训练 数据 ， 还 要 不 断 地 试验 不 同 的 模型 和 参数 ， 因 此 运算 量 
巨大 ， 一 个 训练 模型 可 能 要 成 百 上 干 个 GPU 来 算 。 识 别 的 计算 量 少 很 
多 ， 但 是 用 户 多 (例如 谷歌 、Facebook 的 用 户 都 以 10 亿 计 )〉)， 所 以 总 
的 运算 量 更 大 ， 通 常 是 模型 训练 的 几 十 倍 甚 至 上 百倍 。 由 于 几乎 所 有 
的 深度 学 习 都 从 英 伟 达 买 GPU， 所 以 英 伟 达 心 片 一 直 供 不 应 求 ， 其 股票 
从 2015 到 2017 年 涨 了 10 倍 。 


面 对 如 此 大 的 权力 和 利润 ， 其 他 公司 都 心 有 不 甘 。 首 先是 英特尔 
不 甘心 被 摘 下 霸主 桂冠 ， 开 始 在 CPU 里 集成 更 多 的 核心 ，2017 年 的 Xeon 
Phi 〈 处 理 器 ) 里 面 多 达 72 个 核 。 但 CPU 毕竟 还 要 做 许多 其 他 事情 ， 单 
论 深度 学 习 还 是 远 不 如 同 档次 的 6PU。 先 进 微 器 件 公 司 (Advanced 
Micro Device，AMD) 发 扬 一 贯 的 “ 宁 做 老 二 ”的 传统 ， 在 CPU 上 紧 果 
英特尔 ， 在 GPU 上 紧 盯 英 伟 达 ， 永 远 走 “功能 类 似 ， 价 格 便宜 ”的 路 
线 。 

其 他 几 家 互联 网 巨头 也 不 想 眼 睁 睁 地 看 着 贡 伟 达 控 制 着 深度 学 习 
的 命脉 。 人 谷歌 就 的 起 袖子 自己 做 了 一 款 自用 的 TPU。TPU 的 设计 思路 是 
这 样 的 : 既然 GPU 通过 牺牲 通用 性 换取 了 在 图 形 处 理 方 面 比 CPU 快 15 倍 
的 性 能 ， 为 什么 不 能 进一步 专注 于 只 把 神经 网 络 需要 的 矩阵 运算 做 
好 ， 进 一 步 提高 速度 呢 ? 所 以 TPU 设 计 的 第 一 个 诀窍 是 比 GPU 更 专注 于 
神经 网 络 里 面 计算 量 最 大 的 矩阵 计算 ， 而 不 需要 像 6PU 一 样 去 顾及 图 形 
处 理 的 许多 需求 。TPU 的 第 二 个 诀 守 是 采用 低 精 度 的 计算 。 图 形 与 图 像 
处 理 需 要 很 高 的 精度 (通常 用 32 比 特 浮 点 精度 ) ， 而 用 于 识别 的 神经 
网 络 的 参数 并 不 需要 很 高 的 精度 。 

所 以 谷歌 的 第 一 球 TPU 就 专门 为 识别 设计 ， 在 运算 上 放弃 32 比 特 的 
浮 点 运算 精度 ， 全 部 采用 8 比特 的 整数 精度 。 由 于 8 比特 的 乘法 器 比 32 
比特 的 简单 4X4=16 倍 ， 所 以 在 同等 忆 片 面积 上 可 以 多 放 许 多 运算 单 


元 。 谷 歌 的 第 一 款 TPU 就 有 65 000 个 乘 加 运算 单元 ， 而 最 快 的 GPU 只 有 5 
300 个 单元 。 有 兴趣 的 读者 可 以 看 附录 3 中 对 于 CPU、GPU 和 TPU 的 详细 技 
术 分 析 和 比较 。 


对 于 机 喜 学 习 的 作 片 市 场 ， 不 仅 各 大 半导体 广 商 在 攻 城 略 地 ， 美 
国 、 中 国 、 欧 洲 至 少 有 几 十 家 新 创 公 司 也 在 摩拳擦掌 。 新 创 公 司 有 机 


会 吗 ? 


神经 网 络 芒 片 大 致 可 以 分 成 三 大 类 。 第 一 类 是 数据 中 心里 面 使 用 
的 用 于 训练 模型 和 识别 的 蕊 片 。 目 前 这 类 芯片 几 乎 被 英 伟 达 垄 断 。 这 
类 心 片 客户 不 惜 成 本 ， 不 太 计较 耗 电 ， 只 要 计算 速度 快 。 这 些 心 片 通 
常 都 用 最 新 的 半导体 工 亏 以 便 集 成 最 多 的 晶体 管 。 截 至 本 书 成 稿 时 ， 
最 先进 的 开始 成 熟 商 用 的 半导体 工艺 是 7 纳米 唱 圆 线 ， 使 用 最 新 的 工艺 
成 本 也 最 高 ， 一 个 芯片 从 研发 、 设 计 、 流 片 、 测 试 到 量 产 的 过 程 耗资 
动 辑 数 十 亿美 元 ， 新 创 公 司 通常 没有 这 么 多 钱 ， 风 险 资本 也 不 愿意 冒 
这 么 大 风险 。 即 使 能 生产 出 来 ， 销 售 也 是 一 个 极 大 的 问题 ， 要 说 服 大 
客户 们 使 用 一 家 没有 验证 过 的 忌 片 极为 艰难 ， 除 非 新 创 公 司 的 心 片 能 
比 现 有 芯片 快 至 少 10 倍 以 上 。 如 果 要 比 现 有 芯片 快 10 倍 以 上 ， 那 么 新 
创 公司 在 设计 阶段 至 少 要 比 市 场 最 快 蕊 片 快 100 1 000 倍 ， 因 为 现 有 三 
商 也 不 会 原 地 不 动 ， 也 在 不 断 地 设计 新 一 代 的 芯片 。 即 使 一 个 新 芯片 
能 快 10 倍 ， 编 程 软件 环境 包括 编译 器 、 程 序 库 等 完善 也 需要 知 干 年 的 
时 间 。 缘 上 原因 ， 一 家 新 创 公 司 想 岗 人 饮 数 据 中 心 市 场 风险 非常 大 。 

第 二 类 是 用 于 汽车 自动 轰 驶 或 机 器 人 中 的 芯片 ， 这 类 忆 片 的 耗 电 
不 能 太 大 ， 例 如 在 电动 汽车 里 ， 芯 片 耗 电 不 能 使 电池 巡航 距离 降低 超 
过 1%。 对 成 本 有 一 定 的 要 求 ， 计 算 速 度 也 要 比较 快 。 目 前 英 伟 达 的 GPU 
是 各 大 汽车 厂商 的 首选 ， 英 伟 达 也 将 自动 驾驶 作为 最 重要 的 布局 领 
域 。 

AMD、 高 通 、 英 特 尔 都 在 竞争 这 块 市 场 。 高 通 曾经 想 以 440 亿 美元 
收购 荷兰 半导体 厂商 恩 智 浦 (NXP) 公司 ， 因 为 恩 智 浦 的 芯片 已 经 广泛 
用 在 汽车 的 各 个 控制 系统 里 。2017 年 3 月 ， 英 特 尔 以 153 亿 美元 收购 以 


色 列 汽车 视觉 公司 Mobileye， 从 而 在 高 级 辅助 区 驶 系统 (ADAS ) 市 场 
实现 领先 。AMD 联 合 了 原本 是 英 伟 达 合作 伙伴 的 特 斯 拉 开 发 适用 于 目 动 
轨 驶 的 AI 忌 片 。 在 巨大 的 市 场 潜力 的 吸引 下 ， 一 些 新 创 公 司 也 进入 这 
个 领域 。 但 整体 而 言 新 创 公司 在 这 个 市 场 的 机 会 也 比较 小 ， 原 因 类 
似 : 研发 成 本 太 蜗 ， 客 户 〈 汽 车 公司 和 它们 的 一 级 供应 丙 ) 大 而 保守 


及 
等 。 


第 三 类 是 用 于 各 类 终端 的 芯片 ， 例 如 用 于 摄像 头 、 手 机 、 医 疗 设 
备 、 小 型 机 器 人 等 。 这 类 心 片 要 求 耗 电 非 常 低 〈 例 如 手机 ) ， 成 本 非 
常 低 ， 在 机 器 学 习 类 的 运算 中 速度 只 要 能 比 CPU 快 10 倍 以 上 即 可 。 新 创 
公司 在 这 一 类 芯片 中 机 会 最 大 。 在 这 类 终端 芯片 中 ， 以 手机 市 场 最 
大 ， 但 进入 一 流 手机 厂商 的 机 会 也 最 小 。 例 如 苹果 、 三 星 、 华 为 等 一 
流 手 机 三 商 几 乎 都 用 自己 的 尽 片 以 便 提供 差异 化 用 户 体验 ， 对 它们 来 
说 设计 一 个 神经 网 络 加 速 器 的 难度 并 不 高 。2017 年 苹果 、 华 为 已 将 AI 
元 素 融 入 自家 芯片 ， 发 布 内 置 AI 芯 片 的 ijPhone XY (苹果 手机 ) 、 
Matel0《〈 华 为 手机 ) 每 。 男 外 ， 手 机 蕊 片 三 商 绝 不 会 放弃 这 个 未 来 市 
场 ， 高 通 、 三 星 、 联 发 科 等 计划 在 2018 年 也 推出 融入 人 工 智 能 的 蕊 
产品 ， 其 他 手机 厂商 也 会 陆续 使 用 神经 网 络 心 片 。 即 使 是 二 三 流 的 手 
机 厂商 也 一 定 要求 AI 加 速 芯 片 被 集成 到 CPU 里 而 不 是 增加 一 个 新 的 芯片 
《这 样 几乎 不 增加 成 本 ) 。 新 创 公 司 根本 不 可 能 开发 一 个 全 新 的 带 AI 
加 速 器 的 CPU， 最 多 只 能 把 自己 的 AI 加 速 器 的 设计 给 CPU 芯片 公司 使 
用 ， 但 CPU 芯片 三 商都 有 自己 设计 AI 加 速 器 的 能 力 ， 所 以 AI 芯片 的 新 创 
公司 想 进 入 手机 市 场 几乎 没有 可 能 。 

摄像 头 市 场 规 模 非 常 大 ， 尤 其 是 许多 国家 或 城市 正在 打造 智慧 城 
市 ，AI 心 片 的 需求 潜力 很 难 估 量 ， 很 多 AI 必 片 和 算法 创业 公司 都 将 安 
防 作为 最 重要 的 落地 场景 之 一 ， 但 该 领域 的 集中 度 也 很 高 ， 给 安防 设 
备 三 商 提供 视频 处 理 心 片 的 公司 一 定 会 把 AI 功能 集成 进去 ， 安 防 设备 
龙头 厂家 也 会 研发 自家 的 AI 芯片 。 所 以 新 创 公司 的 最 大 机 会 在 于 为 那 
些 还 不 存在 的 或 者 目前 规模 很 小 的 应 用 提供 芯片 ， 例 如 各 种 小 机 器 


人 、 物 联网 的 应 用 。 投 资 人 要 赌 的 是 这 些 目前 大 三 看 不 上 的 市 场 会 在 
短 短 几 年 内 爆发 。 

许多 读者 会 关心 ， 中 国 的 新 创 公司 在 AI 必 片 上 有 没有 机 会 ? 对 这 
个 问题 的 回答 是 : 上 面 的 分 析 对 任何 一 个 国家 的 新 创 公 司 都 是 适用 
的 。 


生态 大 战 一 一 编程 框 洪 的 使 用 和 选择 


在 AI 领 域 经 常 听 到 一 个 新 技术 名 词 叫 作 “ 编 程 框 架 ”。 这 个 编程 
框架 和 过 去 我 们 熟悉 的 “编程 语言 ”“ 操 作 系 统 ” 是 什么 关系 ? 简单 
讲 ， 所 谓 编程 框架 就 是 一 个 程序 库 。 这 个 库 里 有 许多 常用 的 函数 或 运 
算 〈( 例 如 矩阵 乘法 等 ) 。 这 样 的 程序 库 可 以 大 大 节省 编程 人 员 的 时 
间 。 这 些 编程 框架 的 程序 库 大 多 都 是 “ 面 癌 对 象 ”的 高 级 编程 语言 ， 
例如 C++《〈 计 算 机 程序 设计 语言 ) 、Python (一 种 面向 对 象 的 解释 型 计 
算 机 程序 设计 语言 等 。 高 级 编程 语言 易于 编程 但 效率 低 ， 低 级 编程 
语言 例如 汇编 语言 编程 复杂 但 效率 高 。 用 这 些 高 级 编程 语言 写 的 程序 
库 可 以 在 各 种 不 同 的 操作 系统 上 运行 ， 例 如 Linux (一 种 开源 操作 系 
统 ) 、Windows〔 微 软 电脑 系统 ) 、Mac 0S (苹果 电脑 系统 ) 等 。 

作为 机 器 学 习 的 一 个 早期 现象 ， 现 在 有 许多 种 不 同 的 编程 框架 在 
竞争 。 其 中 比较 著名 的 有 TensorFlow、theano、Caffe、 MXNet、 
CNTK、torch 等 。 这 些 不 同 的 编程 框架 的 本 质 类 似 ， 通 常 都 由 以 下 五 部 
分 组 成 。 


张 量 对 象 


张 量 就 是 一 组 多 维 的 数据 。 例 如 一 组 24 小 时 每 小 时 平均 温度 的 数 
据 就 是 一 个 有 24 个 数据 的 一 维 张 量 ， 也 叫 向 量 。 一 张 480X640 像 素 的 
黑白 图 像 就 是 一 个 二 维 张 量 ， 也 叫 和 矩阵 。 第 一 个 维度 有 480 个 数据 ， 第 
二 个 维度 有 640 个 数据 ， 共 有 480X640 =307 200 个 数据 ， 每 个 数据 的 
值 就 是 这 张 图 中 一 个 像素 的 灰 度 。 如 果 是 一 张 彩 色 图 像 ， 每 个 像素 又 
可 以 分 解 为 红 、 绿 、 赣 三 原色 ， 这 张 图 像 就 变 成 一 个 三 维 的 张 量 ， 一 
共有 480X640X3=921 600 个 数据 。 张 量 是 一 种 能 涵盖 各 种 数据 的 形 
式 ， 不 论 要 处 理 的 数据 是 天 气 、 股 票 、 人 体 生理 指标 、 语 音 、 图 像 还 
是 视频 ， 都 可 以 用 不 同 维度 的 张 量 表 示 。 这 样 数据 的 统一 的 表达 使 数 
学 运算 形式 的 表达 也 能 够 统一 : 都 是 张 量 运算 。 所 以 在 机 器 学 习 计算 
时 《不论 是 训练 模型 还 是 识别 特征 ) 都 要 先 把 数据 转化 为 张 量 形 式 ， 
计算 结果 出 来 以 后 ， 再 从 张 量 形式 转化 为 原来 的 数据 形式 。 在 所 有 的 
张 量 里 ， 最 常用 的 就 是 二 维 张 量 ， 即 矩阵 。 下 面 为 了 直观 易 懂 ， 我 们 
在 讨论 过 程 中 都 用 和 矩阵 作为 张 量 的 代表 。 


对 张 量 的 运算 


基于 神经 网 络 的 机 器 学 习 在 本 质 上 是 对 输入 数据 的 一 系列 矩阵 运 
算 、 卷 积 运算 和 非 线 性 运算 《例如 只 取 正 值 ， 负 值 一 律 等 于 零 的 运 
算 ) 。 作 为 模型 训练 ， 通 过 反问 传 播 不 断 地 调整 加 权 系 数 〈( 即 矩阵 的 
各 个 元 素 ) 使 最 后 的 输出 与 目标 值 的 差 达 到 最 小 。 作 为 特征 识别 ， 将 
输入 数据 经 过 一 系列 矩阵 和 非 线 性 运算 后 提取 出 菜 个 训练 过 的 特征 ， 
然后 再 拿 这 个 特征 和 一 类 已 知 特征 比较 进行 分 类 。 这 些 和 常用 的 运算 例 
如 矩阵 乘法 、 非 线性 处 理 等 都 可 以 成 为 程序 库 里 的 一 个 运算 或 冰 数 。 
当 我 们 调用 这 个 函数 时 ， 只 需要 把 该 填 的 参数 十 进去 ， 例 如 和 矩阵 的 大 
小 和 内 容 ， 而 不 必 再 自己 写 矩 阵 的 具体 运算 。 


运算 流程 图 和 程序 优化 


许多 编程 框架 都 提供 可 视 运 算 流程 图 ， 这 个 工具 可 以 把 一 个 神经 
网 络 的 全 部 运算 用 框图 的 方法 画 出 来 ， 框 图 中 的 每 个 节点 就 是 程序 库 
中 的 一 个 函数 或 运算 (用 编程 语言 说 叫 作 一 个 对 象 》， 这 样 整 个 运算 
非常 直观 ， 也 容易 找到 程序 漏洞。 当 运 算 流程 图 画 出 来 以 后 ， 编 程 框 
架 束 可 以 自动 把 流程 图 变 成 可 执行 程序 。 对 于 一 个 复 洒 的 程序 ， 用 可 
视 流 程 图 方法 男 出 来 后 有 全 局 观 ， 很 容易 优化 《改动 流程 图 比 改 程序 
容易 ，。 编 译 器 (把 用 编程 语言 写 的 程序 转化 成 计算 机 搬 层 指令 的 内 
置 程序 ) 可 以 根据 流程 图 优化 底层 资源 (内 存 、 计 算 等 资源 ) 的 分 
配 。 


目 动 求 导 强 


在 神经 网 络 训练 时 最 复杂 的 计算 就 是 把 输出 误差 通过 反问 传播 ， 

用 最 陡 梯 度 法 来 调整 网 络 各 层 的 加 权 系 数 直 至 输出 误差 最 小 。 这 个 计 
算 基 本 是 一 个 连锁 的 在 网 络 各 层 对 权重 系数 集 求 导 数 的 计算 。 在 大 部 
分 的 编程 框架 中 ， 这 个 连锁 求 导 被 打包 成 一 个 运算 函数 《〈 在 Python 程 
序 库 里 是 一 种 “类 ”) 。 在 有 些 提供 高 级 应 用 接口 的 编程 框架 中 ， 例 
如 TensorFlow， 甚 至 把 整个 “训练 ”打包 成 一 个 运算 〈“ 类 ”) 。 在 
把 运算 流程 图 画 出 来 以 后 《等 于 定义 好 了 神经 网 络 的 大 小 和 结构 ) ， 
只 要 调用 “训练 ”这 个 运算 开始 运算 训练 数据 ， 就 可 以 得 出 训练 好 的 
网 络 参 数 。 


针对 GPU 的 线性 代数 运算 优化 


传统 的 许多 线性 代数 的 函数 是 在 CPU 上 运算 的 。 前 面 介绍 GPU 时 讲 
过 ，GPU 的 特点 是 大 量 的 并 行 计算 。 线 性 代数 中 的 运算 许多 都 是 矩阵 运 
算 ， 而 和 矩阵 运算 中 有 大 量 可 并 行 的 计算 。 由 于 目前 AI 的 计算 平台 以 GPU 
为 主 ， 所 以 许多 原来 第 用 的 线性 代数 函数 和 运算 包 要 重新 写 ， 让 这 些 


运算 充分 并 行 。 但 这 部 分 工作 不 影响 编程 框架 用 户 的 使 用 方式 ， 这 些 
优化 后 的 接口 和 使 用 方式 保持 不 变 。 

这 些 编程 框架 都 是 早期 的 机 器 学 习 编 程 者 为 了 自己 方便 使 用 而 积 
累 出 来 的 程序 库 。 它 们 形成 的 时 间 不 同 ， 目 的 相 异 ， 解 决 的 问题 的 侧 
重 面 也 不 同 。 有 些 框架 提供 的 可 调用 程序 属于 底层 〈 每 个 函数 或 运算 
相对 基本 ， 相 当 于 盖 房 子 的 砖头 ) ， 需 要 编程 人 员 透 彻 理解 神经 网 
络 ， 这 些 底层 程序 库 的 好 处 是 编 出 来 的 程序 灵活 性 高 、 适 用 性 强 、 运 
行 效率 高 。 有 些 框架 提供 的 调用 程序 属于 高 层 〈 每 个 函数 或 运算 复 
杂 ， 相 当 于 盖 房 子 的 预制 板 ， 如 同一 面 墙 ) 。 不 太 懂 神经 网 络 的 人 也 
能 很 容易 编程 ， 但 程序 灵活 性 和 适应 性 受 限 制 ， 运 行 效 率 低 。 另 外 一 
个 主要 不 同 之 处 是 程序 库 内 的 函数 和 运算 的 具体 实现 方法 不 同 ， 有 些 
效率 高 ， 有 些 效率 低 。 关 于 各 主要 编程 框架 在 使 用 单个 和 多 个 GPU 进行 
机 器 学 习 中 最 常见 的 矩阵 运算 和 卷 积 运算 的 效率 比较 ， 可 以 参见 香港 
浸 会 大 学 褚 晓 文 教授 的 论文 《基准 评测 TensorFlow、Caffe、CNTIK、 
MXNet 、Torch 在 三 类 流行 深度 神经 网 络 上 的 表现 》。 想 更 多 地 了 解 这 
些 编程 框架 的 读者 可 以 参阅 附录 4， 其 列 出 了 目前 业界 的 主要 编程 杠 


口 
架 。 


开源 社区 与 AI 生态 


我 们 从 程序 库 的 介绍 可 以 看 出 ， 几 乎 任何 早期 的 机 器 学 习 的 编程 
者 都 会 自己 编写 一 些 常用 的 函数 和 运算 ， 建 一 个 自己 用 的 或 自己 的 公 
司 内 部 用 的 程序 库 。 发 源 于 大 学 的 这 些 程序 库 ， 例 如 发 源 于 加 州 伯 元 
利 大 学 (UC Berkeley) 的 Caffe， 通 常 从 一 开始 就 是 “开源 ”的 ， 也 
就 是 这 些 程序 库 里 面 的 源 代码 都 是 公开 的 。 近 年 来 谷歌 、Facebook、 
微软 、 亚 马 逊 等 公司 也 将 自己 的 程序 库 开 源 。 为 什么 它们 会 如 此 “大 


公 无 私 ”? 当然 这 些 公 司 内 部 推动 开源 的 技术 人 员 中 不 无 理想 主义 
者 ,希望 通过 开源 来 推动 机 器 学 习 的 快速 发 展 。 但 公司 作为 一 个 营利 
主体 ， 开 源 的 主要 商业 动机 是 吸引 更 多 的 软件 编程 人 员 使 用 上 自己 的 编 
程 框架 ， 激 养 一 个 围绕 着 目 己 的 编程 框架 的 生态 系统 。 那 么 “开源 ” 
这 个 游戏 是 怎么 玩 的 呢 ? 程序 源 代码 开放 后 随便 什么 人 都 可 以 改 ， 如 
何 控制 质量 ? 下面 我 们 束 介 绍 一 下 “软件 开源 ”这 个 游戏 的 历史 和 规 
则 。 


软件 开源 在 美国 有 悠久 的 历史 ， 最 成 功 的 开源 项 目 就 是 互联 网 的 
开发 。 从 1962 年 兰 德 公司 提出 互联 网 的 概念 ， 到 1968 年 头 三 个 网 络 节 
点 《斯 坦 福 大 学 、 斯 坦 福 研 究 所 、 加 利 福 尼 亚 州 洛杉矶 大 学 ) 的 连 
接 ， 再 到 网 络 协议 TCP/ZIP 的 开发 和 成 熟 ， 其 间 没 有 任何 政府 部 门 出 面 
组 织 ， 也 不 受 任 何 一 家 公司 控制 ， 完 全 靠 社 区 志愿 者 。 美 国 这 个 国家 
就 是 从 社区 到 小 镇 ， 到 州 ， 再 到 联邦 这 样 自 下 而 上 建立 起 来 的 。 当 
1620 年 从 英国 驶 往 新 大 陆 的 “五 月 花 ” 号 轮船 被 季风 从 原来 的 英 王 特 
许 地 纽约 吹 到 北边 的 元 无 人 烟 的 今天 叫 作 波士顿 的 地 方 时 ， 船 上 的 102 
名 男性 清教徒 在 一 起 订 下 了 “五 月 花 号 圣 约 ”。 这 份 圣 约 就 是 美国 第 
一 个 社区 的 “ 乡 民 公约 ”。 之 后 美国 的 各 个 移民 社区 都 是 这 种 自治 管 
理 模 式 ， 没 有 官 ， 也 没有 “上 级 ”， 所 有 的 社区 都 由 社区 居民 自己 定 
规则 ， 自 己 管理 。“ 政 府 ” 就 是 自己 订 的 乡 民 公约 。 所 以 在 美国 独立 
战争 后 许多 人 认为 根本 没有 必要 成 立 一 个 联邦 政府 。 这 种 强大 的 自治 
传统 是 开源 软件 的 文化 基础 。 所 以 像 互联 网 这 样 无 中 心 ， 没 “领导 ?” 
的 “怪物 ”只 能 在 美国 成 长 起 来 ， 在 世界 任何 其 他 地 方 都 不 太 可 能 。 
这 和 技术 无 关 ， 而 和 文化 、 历 史 有 关 。 互 联网 的 技术 很 简单 ， 只 要 有 
一 台 显 示 终 端 、 电 话 线 和 提供 信息 的 计算 机 就 可 以 搞 互 联网 了 。 其 实 
世界 上 联网 最 早 的 国家 不 是 美国 ， 而 是 法 国 。 法 国 1968 年 就 开发 出 了 
“Minitel”“《〔 法 国 自行 建立 的 国家 网 络 ， 建 成 早 于 互联 网 ) ， 由 法 国 
邮电 部 开发 、 控 制 。1982 年 就 在 全 国 铺 开 ， 给 每 个 居民 家 里 面 安装 一 
个 统一 的 终端 ， 通 过 电话 线 连接 到 邮电 部 的 数据 库 里 ， 可 以 查 天 气 、 
订 票 等 。 法 国 这 样 的 欧洲 大 陆 国 家 有 悠久 的 星 权 传 统 ， 从 一 开始 就 和 


美国 的 思路 完全 相反 ， 一 切 由 邮电 部 控制 。 在 互联 网 的 冲击 下 ， 法 国 
Minitel 和 其 他 国家 政府 控制 管理 的 互联 网 门户 一 样 早 束 荡然 无 存 。 回 
过 头 看 ， 误 优 执 劣 一 目 了 然 。 


软件 开源 也 是 一 个 社区 ， 这 个 社区 也 有 乡 民 公约 ， 这 个 公约 的 主 
要 内 容 就 是 鼓励 每 个 人 分 享 对 开源 软件 的 改进 。 经 过 多 年 的 演进 ， 目 
前 开源 社区 的 公约 大 多 使 用 “Apache2. 0 协议 ”。 这 个 协议 的 主要 规则 
如 下 : 任何 人 都 可 以 使 用 Apache 2. 0 协议 许可 下 的 软件 ， 并 且 可 以 用 
于 商业 ; 任何 人 都 可 以 任意 修改 原 有 的 软件 ， 并 将 修改 后 的 软件 申请 
商标 和 专利 ， 但 修改 的 软件 必须 注 明 使 用 了 Apache 2.0 的 许可 ， 必 须 
明确 标示 修改 的 部 分 。 


开源 社区 允许 在 开源 软件 的 基础 上 开发 自己 的 商用 软件 ， 而 大 多 
数 商用 软件 是 不 愿意 公开 的 。 那 么 开源 社区 如 何 解决 “搭便 车 ”的 问 
题 呢 ? 这 个 问题 就 像 问 为 什么 总 有 人 愿意 出 头 为 社 群 出 力 ， 为 什么 人 
会 有 利他 的 动机 。 答 案 在 于 种 群 的 竞争 和 演化 。 设 想 远古 两 个 邻近 的 
部 落 ， 第 一 个 部 落 里 面 的 所 有 人 都 很 自私 ， 另 一 个 部 落 里 面 有 些 人 原 
意 为 大 家 冒 风险 和 做 事 ， 第 二 个 部 落 的 合作 能 力 和 战斗 力 就 会 比 第 一 
个 强 ， 两 个 部 落 发 生 战 争 时 第 二 个 部 落 就 会 把 第 一 个 部 落 消 灭 了 。 屠 
些 “ 纯 自私 ”的 人 的 基因 就 无 法 遗传 下 来 ， 而 获胜 存活 下 来 的 基因 中 
就 会 有 利他 成 分 。 就 像 我 们 在 日 常生 活 中 看 到 的 一 样 ， 一 个 社 群 中 愿 
意 牺 牲 自己 的 利益 为 大 家 服务 的 人 虽然 总 是 极 少数 但 永远 存在 。 开 源 
社区 其 实 是 同一 个 道理 ， 在 里 面 免费 干 活 不 断 改进 软件 的 人 也 是 少 
数 ， 所 以 许多 开源 社区 都 是 一 路 艰难 。 但 是 对 于 那些 逐渐 成 为 重要 基 
础 设施 的 开源 软件 ， 例 如 互联 网 协议 、 操 作 系统 Linux 等 ， 就 会 有 更 多 
的 人 来 关心 和 付出 。 例 如 许多 商业 公司 使 用 了 这 些 开源 软件 ， 一 旦 公 
司 做 大 ， 这 些 公司 就 非常 关心 这 些 开源 软件 的 改进 、 更 新 和 安全 。 这 
些 公司 就 会 出 钱 出 力 。 还 有 一 些 用 户 也 会 捐献 ， 许 多 常年 依赖 维基 百 
科学 习 和 检索 的 读者 ， 因 为 希望 这 个 工具 越 来 越 有 用 ， 就 会 定期 捐款 
支持 。 笔 者 已 经 不 能 想象 离开 维基 百科 这 样 的 工具 该 怎么 工作 和 生 
活 。 但 以 上 这 些 因素 仍然 没 能 彻底 解决 开源 社区 “搭便 车 ”的 问题 。 


这 和 我 们 在 一 个 社 群 社区 的 情况 完全 相同 ， 总 有 人 会 “搭便 车 ”。 区 
块 链 技术 的 出 现 也 许 能 彻底 解决 这 个 问题 ， 这 又 是 一 个 很 长 的 话题 。 
笔者 也 许 会 在 下 一 本 关于 区 块 链 对 社会 的 冲击 的 书 中 详 述 。 

所 以 有 了 开源 的 编程 框架 以 后 ， 大 量 的 AI 应 用 开发 公司 就 可 以 使 
用 现成 的 程序 库 而 不 必 从 头 开 始 。 这 就 大 大 降低 了 AI 应 用 的 技术 门 
松 。 一 个 不 懂 机 器 学 习 的 有 经 验 的 软件 工程 师 ， 可 以 用 一 个 月 时 间 在 
网 上 学 一 门 机 器 学 习 的 基础 课程 ， 再 花 一 周 时 间 就 可 以 掌握 像 谷 歌 的 
TensorFlow 这 样 的 编程 框架 。 所 以 今天 融资 的 新 创 技术 型 公司 都 可 以 
说 自己 是 “AI 公 司 ”。 如 有 果 这 些 公司 的 技术 都 使 用 开源 编程 框架 ， 它 
们 的 技术 差别 就 很 小 。 因 此 这 些 公 司 比拼 的 是 对 某 个 行业 的 理解 和 在 
该 行业 的 营销 能 力 ， 以 及 对 该 行业 数据 的 占 先 和 占有 程度 。 有 AI 技术 
实力 的 公司 通常 不 完全 依赖 开源 的 编程 框架 ， 而 是 自己 开发 很 多 自己 
专用 的 底层 程序 库 ， 甚 至 有 上 自己 的 编程 框架 。 


在 AI 的 开源 运动 中 ， 除 了 各 大 学 和 各 大 技术 公司 的 开源 编程 杠 
架 ， 还 有 一 些 纯粹 的 公益 组 织 。 其 中 最 著名 的 就 是 由 “钢铁 侠 ” 马 斯 
区 和 迄今 最 成 功 的 县 化 器 之 一 Y Combinator 的 创始 人 山姆 。 芯 特 曼 
(Sam Atman) 创建 的 Open AI。 创 办 0pen AI 的 动机 有 两 个 : 一 是 不 能 
让 大 公司 控制 人 类 未 来 最 重要 的 技术 之 一 。 这 一 点 和 当年 乔布斯 、 疼 
次 发 起 个 人 电脑 单 命 时 的 驱动 力 相 同 : 不 能 让 IBM 这 样 的 大 公司 垄断 计 
算 机 技术 。 二 是 现在 就 开始 警惕 AI 对 人 类 社会 的 潜在 威胁 〈 我 们 将 在 
第 七 章 专门 讨论 此 问题 ) 。0pen AI 的 使 命 是 “AI 民主 化 ”。 意 思 是 要 
让 更 多 的 人 掌握 AI 技 术 ， 让 更 多 的 人 受 惠 于 AI。 也 有 人 反 驶 说 让 每 个 
人 都 掌握 一 种 威力 无 比 强 大 的 技术 是 否 使 人 类 更 安全 ? 应 该 说 对 AI 的 
担心 是 明确 的 ， 但 如 何 使 AI 更 安全 的 路 径 是 模糊 的 。 但 这 就 是 那些 创 
业 家 的 性 格 ， 只 要 大 方 各 对 了 束 先 干 起 来 再 说 。0pen AI 的 最 大 挑战 是 
如 何 吸引 第 一 流 的 人 才 。 在 硅谷 ， 顶 级 的 AI 人 才 的 工资 、 奖 金 、 期 权 
加 起 来 每 年 可 达 数 百 万 美元 ， 而 0pen AI 作为 一 家 非 营利 性 机 构 ， 只 能 
给 出 一 般 的 市 场 价 〈 例 如 每 年 20 万 30 万 美元 ) 。 即 使 如 此 ， 也 曾经 吸 
引 了 重量 级 的 AI 大 神 ， 例 如 发 明了 生成 对 抗 网 络 的 宕 。 上古 德 菲 勒 (Ian 


Goodfellow) 等 人 。0pen AI 的 主要 研究 工作 集中 在 通用 人 工 智 能 ， 使 
用 开源 社区 的 方法 吸引 全 世界 的 AI 人 才 来 贡献 。0pen AI 是 否 能 够 最 终 
成 为 AI 生态 中 的 一 支 重 要 力量 ， 还 要 看 他 们 的 研究 结果 是 否 能 被 广泛 
应 用 ， 要 看 这 些 为 理想 而 来 的 年 轻 人 能 否 禁 得 住 市 场 以 10 倍 以 上 的 待 
过 把 他 们 控 走 。 


乱世 时 雄 


今天 的 AI 就 像 20 年 前 的 互联 网 ， 是 兵家 必 争 之 地 。 几 乎 所 有 的 大 
公司 都 在 争夺 高 地 。 其 中 最 有 代表 性 的 就 是 世界 上 几 大 科技 和 互联 网 
巨头 : 谷歌 、Facebook、 亚 马 还 、 微 软 、IBM、 百 度 、 阿 里 巴巴 、 腾 讯 
等 。 这 些 巨头 可 以 分 为 三 类 : 第 一 类 是 掌握 大 量 用 户 数 据 的 互联 网 公 
司 ; 第 二 类 是 微软 和 IBM 这 样 的 技术 公司 ; 第 三 类 是 华为 、 小 米 等 这 类 
缺乏 数据 ， 但 有 应 用 场景 ， 又 希望 通过 AI 提升 自身 产品 的 公司 。 第 一 
类 公司 首先 在 自己 的 数据 上 全 面 使 用 AI 技术 ， 例 如 图 片 搜索 、 用 户 行 
为 预测 、 智 能 推荐 等 。 第 二 类 公司 则 希望 打造 AI 云 计算 让 客户 使 用 。 
第 三 类 公司 积极 和 前 两 者 进行 合作 ， 或 快速 将 它们 的 AI 开 源 能 力 运 用 
到 上 自身 的 产品 中 。 


在 互联 网 公司 中 ， 技 术 驱 动 型 的 公司 例如 谷歌 和 百度 都 是 在 AI 战 
略 上 最 激进 的 公司 。 谷 歌 放 弃 了 “移动 第 一 ”的 战略 ， 提 出 “AI 第 
一 ”的 新 战略 。 百 度 也 宣称 自己 是 一 家 AI 公司 ， 要 全 力 以 赴 投 入 
AI (all in AI) 。 人 谷歌 和 百度 除了 在 上 自己 的 数据 优势 上 全 面 使 用 AI 以 
外 ， 也 四 面 出击 ， 企 图 进入 自己 不 占有 数据 优势 的 垂直 行业 ， 例 如 自 
动 驾 驶 和 医疗 健康 行业 。 中 美的 搜索 公司 在 进入 垂直 行业 上 比 社交 网 
络 和 电子 商务 公司 更 激进 的 另外 一 个 原因 是 搜索 公司 的 用 户 数据 比 社 
交 和 商务 的 用 户 数据 “ 浅 ”， 控 掘 的 价值 没有 社交 和 商务 用 户 高 。 


这 些 互联 网 和 科技 巨头 都 在 云 计 算 方向 上 激烈 竞争 ， 每 家 都 希望 
自己 的 AI 云 计算 占有 最 大 的 市 场 份额 ， 亚 号 还 、 谷 歌 、 百 度 、IBM、 腾 
讯 等 都 在 其 云 计算 平台 推出 了 计算 机 视觉 、 语 首 识 别 、 上 自然 语言 处 
理 、 翻 译 等 能 力 。 谷 歌 传统 的 云 计算 市 场 份 额 远 不 如 亚 马 进 ， 但 AI 为 
其 提供 了 一 个 翻身 的 机 会 。 谷 歌 开 发 自己 的 TPU， 除 了 降低 成 本 以 外 ， 
更 重要 的 是 TPU 能 够 对 TensorFlow 编 程 框架 下 的 计算 提供 更 快 的 计算 。 
相对 于 亚 马 进 的 云 服务 AWS 等 竞争 对 手 ， 谷 歌 不 仅 可 以 提供 成 本 更 低 、 
拥有 更 强 AI 能 力 的 云 计算 服务 ， 还 可 以 进一步 吸引 更 多 的 人 使 用 谷歌 
的 编程 框架 TensorFlow。 这 样 TensorFlow 和 谷歌 的 云 计算 服务 的 绑 定 
束 越 紧密 ，TensorFlow 和 基于 TPU 的 云 计算 束 形成 了 正 循 环 。 目 前 
TensorFlow 的 SDK( 开 发 工具 包 ) 在 全 球 有 1 000 万 次 下 载 ， 授 布 180 个 
国家 和 地 区 。 同 时 谷歌 去 AI 团队 正在 快速 降低 AI 技术 上 的 门槛 。2018 
年 初 ， 谷 歌 发 布 全 新 的 “自动 机 器 学 习 云 ” (Cloud AutoML) ， 不 会 
用 谷歌 编程 框架 或 任何 编程 框架 的 人 也 可 以 创建 机 器 学 习 模 型 ， 用 户 
只 需 上 传 数据 便 能 自动 创建 机 器 学 习 模 型 ， 包 括 训 练 和 调试 。 目 前 已 
经 有 上 万 家 企业 使 用 谷歌 的 自动 机 器 学 习 云 服务 。 

华为 在 通信 设备 、 移 动 终端 领域 有 领先 优势 ， 虽 然 该 公司 很 早 就 
部 署 了 AI， 但 是 在 AI 技术 上 整体 还 是 大 幅 落 后 于 谷歌 、 百 度 这 类 公 
司 。 因 此 该 公司 采用 了 全 面 开 放 合 作 的 态度 ， 构 建 自 身 的 AI 能 力 ， 以 
便 升 级 现 有 的 产品 与 服务 能 力 。 华 为 通过 开放 平台 的 搭建 ， 在 心 族 层 
一 开始 采用 了 寄 武 纪 的 NPU《〈 秽 入 式 神 经 网 络 处 理 器 ) ， 在 语音 交互 方 
面 采 用 了 科大 讯 尺 和 自主 研发 相 结 合 ， 并 通过 开放 的 架构 和 战略 合作 
将 谷歌 的 TensorFlow、 百 度 的 Paddle Paddle 等 深度 学 习 能 力 便捷 地 提 
供给 开发 者 与 合作 伙伴 ， 并 和 微软 联合 开发 内 置 于 系统 层 的 机 器 翻译 
功能 ， 以 及 和 商 汤 等 公司 联合 开发 AI 技术 ， 以 便 为 旗下 产品 打造 更 多 
的 AI 型 应 用 ， 拉 开 和 竞争 对 手 的 距离 。 


大 卫 和 哥 利 亚 


大 公司 既 有 技术 又 有 数据 ， 那 新 创 公 司 怎么 活 ? 简单 来 讲 ， 新 创 
的 AI 公司 要 进入 大 公司 不 占有 数据 优势 的 那些 垂直 的 行业 。 这 样 的 行 
业 又 可 以 分 为 两 类 : 一 类 是 新 兴 领 域 ， 以 前 完全 没有 人 做 ， 一 切 从 头 
开始 ; 男 一 类 是 原 有 行业 ， 例 如 金融 、 保 险 、 能 源 等 。 新 创 公 司 进 入 
第 一 类 行业 最 容易 ， 因 为 大 公司 通常 不 会 进入 一 个 全 新 的 、 市 场 还 未 
知 的 领域 ， 目 动 驾 驶 和 人 脸 识 别 部 是 这 样 的 新 兴 领 域 。 目 前 在 美国 和 
中 国 做 自动 驾驶 的 新 创 公 司 有 上 百 家 ， 在 中 国 做 人 脸 识 别 的 公司 也 有 
数 百 家 。 与 任何 新 兴 领 域 一 样 ， 这 些 新 创 公司 的 大 部 分 将 被 淘汰 或 并 
购 ， 尤 其 是 目 动 罗 驶 ， 其 属于 未 来 汽车 广 商 之 间 竞 争 的 核心 技术 ， 又 
牵涉 到 安全 。 大 车 广 不 可 能 把 这 样 的 技术 交 给 一 家 创业 公司 《二 流 以 
下 车 广 有 可 能 ， 所 以 还 是 有 市 场 的 ) 。 它 们 要 么 自己 建 研发 队伍 ， 要 
么 收购 最 好 的 目 动 驾驶 软件 公司 ， 目 前 几乎 所 有 的 一 线 国 际 大 车 广 都 
己 经 这 么 做 了 。 目 动 驾 驶 软件 公司 遇 到 的 第 二 个 问题 是 它们 的 软件 通 
常 要 通过 一 级 供应 商 (Tier1) 的 集成 后 进入 车 三 。 但 一 流 的 一 级 供应 
商 也 认为 目 动 轨 驶 是 它们 未 来 的 核心 部 和 争 力 ， 也 是 要 么 目 建 研发 ， 要 
么 收购 ， 也 不 会 把 人 命 关 天 的 事 交 给 一 家 新 创 公 司 。 所 以 那些 没 能 被 
收购 的 自动 驾驶 软件 公司 最 后 要 么 去 攻 比 较 人 简单 的 、 限 定 的 场景 ， 例 
如 校园 、 景 区 、 小 区 等 ， 要 么 去 攻 垂 直 市 场 ， 例 如 卡车 、 港 口 、 仓 库 
等 。 而 人 脸 识 别 由 于 应 用 场景 不 同 ， 客 户 要 求 不 同 〈 例 如 友 现 犯罪 分 
子 和 刷 脸 文 付 要 求 完 全 不 同 ) ， 所 以 可 以 容纳 更 多 的 三 家 存活 。 


现在 难以 看 清楚 的 是 那些 既 有 钱 义 有 数据 的 传统 行业 ， 例 如 人 金 
融 、 能 源 、 医 疗 等 。 在 这 些 领 域 有 三 类 竞争 者 : 第 一 类 是 本 行业 内 部 
的 团队 ， 例 如 许多 证 券 公 司 已 经 开 始 大 规模 目 建 AI 交易 和 理财 团队 。 
第 二 类 是 各 大 互联 网 公司 企图 挟 巨 大 技术 优势 进入 或 者 颠 履 传统 行 
业 ， 例 如 谷歌 和 腾讯 都 企图 进入 医疗 领域 。 第 三 类 是 企图 进入 垂直 行 
业 的 新 创 AI 公 司 。 两 个 有 意思 的 行业 是 证 券 区 易 和 医疗 图 像 。 前 者 几 


乎 都 在 建立 自己 的 团队 和 能 力 ， 而 后 者 则 基本 都 和 外 面 合 作 。 对 于 证 
券 公司 来 讲 ，AI 算 法 是 未 来 交易 的 核心 技术 ， 证 券 公司 必须 掌握 。 交 
易 算 法 必须 由 技术 团队 和 交易 团队 紧密 配合 快速 迭代 ， 算 法 和 数据 必 
须 严 格 保 密 ， 所 以 很 难 外 包 。 而 医疗 成 像 识别 目前 主要 是 提高 x 光 读 片 
效率 ， 不 是 生死 侯 关 的 技术 ，X 光 读 片 对 于 一 家 医院 来 说 只 是 很 小 的 一 
部 分 业务 。 美 国 的 大 连锁 医疗 集团 例如 凯撒 〈Kaiser Permanente) 等 
还 有 一 些 内 部 的 技术 资源 ， 大 部 分 美国 和 中 国 的 医院 基本 没有 这 样 的 
技术 能 力 。 医 疗 图 片 即使 泄露 到 同行 手 里 ， 对 医院 本 里 也 不 会 造成 致 
命 伤 害 。 所 以 它们 愿意 承包 给 外 面 做 。 新 创 AI 企 业 是 否 能 顺利 进入 传 
统 行业 ， 要 看 AI 技术 在 这 个 行业 中 的 作用 和 对 数据 的 敏感 程度 。 预 计 
银行 和 保险 行业 将 和 证 券 业 类 似 ， 不 会 愿意 分 享 数 据 外 包 AI， 大 银行 
和 保险 公司 都 将 以 自己 为 主 。 所 以 AI 公 司 只 能 去 攻 那 些 中 小 规模 的 企 
业 ， 它 们 自己 没有 技术 能 力 ， 又 面临 被 淘汰 的 危险 。 还 有 一 种 做 法 就 
是 与 新 业态 合作 ， 例 如 新 兴 互 联网 银行 、 互 联网 保险 。 这 些 公 司 有 互 
联网 和 大 数据 基因 ， 属 于 行业 新 进入 者 ， 做 法 激进 ， 天 然 拥 抱 AI 技 
术 。 但 对 这 类 公司 来 说 ，AI 将 是 核心 技术 ， 它 们 最 终 还 是 要 自己 做 ， 
也 许 会 收购 外 包 团 队 。 

总 体 来 讲 ， 今 天 AI 创业 公司 进入 传统 行业 的 商业 模式 还 都 不 清 
晰 ， 如 果 有 选择 ， 那 么 在 为 传统 行业 增加 效率 和 从 外 部 颠 履 传统 行业 
两 者 之 间 ， 前 者 更 容易 ， 但 后 者 利益 更 大 。 


许多 人 今天 对 AI 新 创 公 司 的 一 个 担忧 就 是 用 户 数据 都 在 互联 网 巨 
头 手 里 。 这 是 一 种 静态 的 看 法 ， 今 天 互联 网 公司 的 数据 主要 是 人 们 使 
用 电脑 和 手机 产生 的 浏览 数据 ， 和 它们 并 不 掌握 下 列 几 大 类 对 人 类 有 用 
的 ，AI 也 需要 用 的 数据 。 


(1) 人 类 本 刁 的 数据 ， 例 如 身体 数据 和 心理 数据 。 
(2) 环境 数据 ， 其 中 包括 上 自然 环境 、 社 会 环境 。 
(3) 各 种 人 类 劳动 过 程 数据 ， 例 如 农业 、 工 业 、 服 务 业 的 过 程 数 


据 。 


人 类 郁 动 过 程 中 的 数据 是 未 来 最 重要 的 数据 ， 筋 动 过 程 无 非 是 对 
一 个 给 定 的 环境 施加 一 组 行为 ， 让 这 个 给 定 的 环境 变 得 对 人 类 更 有 利 
(例如 给 一 块 地 播种 、 治 水、 施肥 ， 使 之 长 出 庄 穆 冶炼 铁 矿石 变 成 
钢 ， 给 患者 打针 吃 药 治 愈 疾病 〉)。 只 要 这 个 环境 能 够 被 测量 ( 庄 称 再 
产 、 人 矿石 和 钢铁 质量 、 人 体 健康 程度 )， 这 组 行为 能 够 被 控制 ( 浇 水 
施肥 量 、 高 炉 温度 、 药 的 种 类 剂量 ) ， 机 器 学 习 就 可 以 被 用 来 优化 这 
个 过 程 。 所 以 一 切 能 够 被 测量 的 环境 和 过 程 都 将 产生 机 器 学 习 需 要 的 
数据 。 几 十 年 以 后 回头 再 看 ， 人 类 上 网 和 玩 手机 产生 的 那 点 数据 根本 
就 不 叫 数据 。 如 果 把 数据 比 作 金 矿 ， 那 么 互联 网 巨头 今天 拥有 的 无 非 
征地 表面 沙土 里 一 层 浅 浅 的 金沙 ， 真 正 的 金 净 将 都 还 埋 在 迄今 没 发 现 
的 地 方 。 这 些 地 方 有 些 是 我 们 前 面 提 到 的 现 有 行业 ， 有 些 是 我 们 今天 
还 没 看 到 的 环境 和 过 程 。 随 着 各 类 传 感 硕 成 本 的 降低 ， 越 来 越 多 的 环 
境 被 更 细密 地 感知 。 随 着 物 联网 的 普及 ， 这 些 无 所 不 在 的 传感器 将 搜 
集 到 比 今天 互联 网 大 许多 数量 级 的 数据 。 


新 创 公 司 和 大 公司 苋 搜 的 最 大 的 优势 还 是 人 才 和 激励 机 制 。 创 业 
者 通常 都 是 最 优秀 、 最 有 激情 、 敢 于 骨 险 的 一 批 人 。 新 创 公司 在 一 个 
全 新 领域 可 以 随时 掉头 ， 快 速 欠 代 ， 迅 速 措 清 市 场 需求 ， 它 们 所 有 的 
脑筋 都 会 放 在 如 何 满足 用 户 需 求 上 。 而 在 大 公司 很 少 有 人 愿意 冒 风险 
尝试 新 东西 ， 有 些 项 目 会 牵涉 许多 部 门 利 益 ， 想 做 一 件 事 要 花 大 量 时 
间 去 协调 ， 有 时 还 会 打 得 不 可 开交 。 几 是 在 大 公司 符 过 的 人 对 此 都 深 
有 体会 。 以 半自动 区 驶 功能 为 例 ， 特 斯 拉 率 先 推出 目 动 线 道 保持 功 
能 ， 使 驾驶 员 开 车 时 可 以 不 扶 方 向 盘 。 这 个 线 道 识 别 技术 最 初 是 以 色 
列 公司 Mobileye 提 供 的 ， 其 他 使 用 Mobileye 方 案 的 汽车 广 家 按理 说 都 
可 以 推出 这 个 功能 但 却 没 有 ， 因 为 这 个 功能 风险 很 大 。 传 统 车 三 的 中 
高 层 经 理 打 死 都 不 会 签字 发 布 这 个 功能 ， 后 来 也 确实 出 现 了 交通 事故 
的 例子 。 特 斯 拉 发 布 这 样 的 功能 极 可 能 就 是 老板 目 己 担 的 板 ， 因 为 除 
了 利益 之 外 ， 创 始 人 天 天 泡 在 产品 上 ， 对 细节 非常 了 解 ， 拍 板 时 心里 
多 少 有 数 。 一 个 新 功能 谁 者 无 法 打包 了 票 ， 不 冒 这 样 的 风险 惑 无 法 在 目 
动 获 驶 技术 上 领先 ， 无 法 领先 新 创 公司 就 存活 不 下 去 。 而 传统 大 公司 


的 CE0 都 是 职业 经 理 人 ， 对 茶 个 有 具体 功能 不 可 能 了 解 得 那么 细 ， 要 依赖 
一 层 一 层 的 建议 ， 如 有 果 下 面 没 人 愿意 担 这 个 风险 ，CE0 就 不 敢 随 便签 
字 。 传 统 大 公司 的 第 二 个 问题 是 激励 机 制 无 法 和 新 创 公 司 比 。 大 公司 
那 点 奖金 和 期 权 没 法 与 创业 公司 的 期 权 比 (如 果 成 功 ) ， 大 公司 内 部 
的 人 事 斗 争 和 协调 成 本 都 会 把 那些 乔 商 高 的 技术 天 才 吓 跑 ， 即 使 招来 
也 会 气 走 。 传 统 车 厂 有 资金 、 渠 道 ， 甚 至 也 掌握 了 相应 的 搁 术 ， 由 于 
上 述 种 种 原因 也 只 能 眼睁睁 地 看 着 特 斯 拉 这 样 的 公司 冒 出 头 来 把 它们 
甩 得 越 来 越 远 。 


AI 的 技术 推动 力 


许多 人 都 在 关心 AI 这 流行 情 还 能 走 多 高 、 走 多 远 。 如 果 说 算法 是 
AI 引擎 的 设计 ， 算 力 是 引擎 的 马力 ， 数 据 是 引擎 的 燃料 ， 那 么 让 我 们 
分 别 看 看 这 些 技 术 推 动力 的 发 展 。 


算法 


前 面 介绍 过 ， 目 前 新 算法 层出不穷 ， 有 些 在 继续 沿 着 神经 网 络 的 
方向 走 ;， 有些 开始 探讨 其 他 路 径 ， 例 如 贝 叶 斯 网 络 、 支 持 癌 量 机 ; 有 
些 在 把 不 同 的 算法 融合 起 来 ， 有 的 干脆 另辟蹊径 ， 提 出 新 的 人 脑 认 知 
模型 。 算 法 的 研究 目前 非常 活跃 ， 在 未 来 5 10 年 还 会 有 大 量 新 的 算法 
涌现 。 


算 力 


算 力 的 增加 基于 摩尔 定律 。 目 前 除了 已 片 的 线 宽 继续 变 窗 〈 最 新 
半导体 工艺 线 宽 4 纳 米 ) 导致 集成 度 继续 变 高 以 外 ， 还 有 各 种 封装 技 
术 ， 例 如 三 维 芯 片 封装 可 以 将 64 个 芯片 摆 在 一 起 。 目 前 芯片 的 耗 电 比 
人 脑 耗 电 还 大 几 个 数量 级 ， 在 许多 数据 中 心 能 耗 成 为 制约 瓶颈 ， 大 幅 
度 降 低 耗 电 也 是 必 片 设计 的 重要 方向 。 虽 然 单个 心 放 计算 能 力 的 增长 
变 缓 ， 但 是 现在 倾向 于 用 越 来 越 多 的 必 片 。 对 于 AI 计算 来 讲 ， 不 论 是 
训练 还 是 识别 ， 重 要 的 不 仅 是 单个 芯片 的 能 力 ， 更 是 能 够 把 多 少 心 
有 效 地 组 织 在 一 起 来 完成 一 个 计算 任务 。2012 年 以 前 还 很 少 使 用 GPU， 
现在 一 个 计算 任务 动 辑 使 用 成 千 上 万 个 GPU 或 专用 计算 芯片 ， 例 如 
TPU。2018 年 0pen AI 发 布 的 一 份 报告 显示 ， 和 上 自 2012 年 以 来 ， 在 AI 训练 
运行 中 所 使 用 的 计算 能 力 呈 指数 级 增长 ， 每 3. 5 个 月 增长 一 倍 。2012 一 
2018 年 ， 这 个 指标 已 经 增长 了 30 万 倍 以 上 。 具 体 说 就 是 2018 年 谷歌 的 
AlphaGo Zero 比 2012 年 ImageNet 大 赛 获 胜 的 AlexNet 快 了 30 万 倍 。 


数据 


数据 的 增加 基于 传 感 右 或 存储 器 越 来 越 便宜 ， 几 乎 所 有 传 感 硕 和 
存储 天 的 成 本 都 是 由 芯片 成 本 决定 的 。 当 尾 片 集成 度 提 高 ， 必 片 需求 
量 增 大 时 ， 传 感 希 和 存储 器 的 成 本 会 大 幅度 下 降 ， 更 多 的 传 感 右 会 产 
生 更 多 的 数据 。 

综 上 上 所 述 ， 推 动 AI 的 三 个 技术 要 和 聚 都 在 快速 发 展 ， 所 以 目前 AI 只 
是 莱特 兄弟 刚刚 把 飞机 飞 离 地 面 ， 离 5 马赫 超 音 速 还 很 远 。 

从 市 场 看 ， 目 前 受到 AI 冲击 的 传统 行业 还 很 少 ， 大 部 分 行业 还 没 
有 开始 被 改造 、 被 题 履 ， 因 为 AI 从 业者 都 在 忙 乎 进入 那些 没有 传统 巨 
头 的 行业 ， 例 如 入 脸 识 列 和 目 动 驾驶 。 

图 4. 3 是 一 个 很 著名 的 “新 技术 成 熟 曲线 ”。 互 联网 过 去 20 多 年 的 
发 展 束 非常 符合 这 条 曲线 : 一 个 新 的 重大 技术 创新 一 开始 没 多 少 人 相 
信 ， 但 超过 一 个 转折 点 后 就 开始 被 热 炒 ， 大 家 的 期 望 值 都 很 高 ， 大 量 


的 资金 言 目 进入 ， 很 快 发 现 技术 还 不 成 熟 ， 远 不 能 达到 期 望 值 ， 大 家 
都 很 失望 ， 行 业 跌 落 到 谷底 。 但 这 个 技术 其 实 只 是 需要 时 间 ， 经 过 一 
段 时 间 成 熟 起 来 ， 就 会 重新 站 上 高 地 。 就 互联 网 来 说 ， 今 天 的 发 展 远 
远 超过 了 2000 年 泡沫 时 最 狂 野 的 想象 。 

可 见 性 


期 望 膨 胀 期 


平衡 成 熟 期 


技术 萌芽 期 时 间 


图 4.3 新 技术 成 熟 曲线 


图 片 来 源 : https://www. gartner. com/smarterwithgartner/whats-new-in- 
gartners-hype-cycle-foremerging-technologies-2015/。 


那么 AI 处 在 这 条 曲线 的 什么 位 置 呢 ? 大约 在 峰值 刚 过 ， 还 远 未 到 
低谷 。 注 意 这 条 曲线 只 是 个 一 般 性 规律 ， 并 不 准确 ， 也 不 一 定 适 用 所 
有 新 技术 ， 即 许多 新 技术 都 会 经 历 这 么 两 个 起 伏 ， 但 不 同 的 技术 起 伏 
幅度 不 同 。 笔 者 预测 AI 有 “冷静 期 ”而 没有 “幻灭 期 ”， 因 为 AI 在 许 
多 行业 都 已 经 证 明 有 用 。 回 头 看 过 去 几 年 还 是 有 一 些 泡 沫 ， 泡 沫 体现 
在 某 些 领域 出 现 大 量 同 质 化 公司 和 这 些 领 域 融资 的 估 值 上 面 。 据 不 完 
全 统计 ， 中 美 两 国 的 自动 驾驶 公司 已 经 超过 100 家 ， 中 国 号 称 做 人 脸 识 
别 的 公司 有 数 百 家 。 显 然 市 场 不 需要 这 人 么 多 家 企业 。 在 自动 轨 驶 领域 


一 个 没有 任何 收入 ， 也 看 不 到 清晰 商业 模式 的 公司 可 以 喊 价 到 数 亿 美 
元 的 估 值 。 估 值 泡 沫 通常 都 是 由 于 一 次 估 值 离谱 的 收购 造成 的 。 通 用 
汽车 公司 在 2016 年 宣称 以 10 亿 美元 的 估 值 收购 了 位 于 旧金山 的 Cruise 
Automation， 以 后 所 有 的 自动 驾驶 公司 都 以 这 次 收购 作为 自己 估 值 的 
对 标 。 所 有 投资 自动 要 驶 公司 的 投资 者 都 赌 自己 投资 的 公司 也 会 被 高 
价 收购 。 但 是 即使 所 有 大 的 整 车 广 商 都 收购 一 家 自动 轨 驶 软件 公司 ， 
市 场 也 不 需要 上 百 家 同 质 化 的 公司 。 当 供 大 于 求 时 ， 收 购 价 格 也 会 大 
幅度 降低 。 笔 者 预计 在 今后 2 3 年 中 ， 大 部 分 同 质 化 公司 在 资金 耗 尽 后 
将 因为 无 法 进一步 融资 而 死亡 ， 与 此 同时 ， 少 数 几 家 技术 独特 或 市 场 
能 力 强 且 资 金 雄厚 的 公司 将 快速 发 展 。 

目前 许多 融资 的 新 创 公 司 都 宣称 自己 是 AI 公司 或 者 使 用 AI 技术 。 
但 这 些 公司 的 技术 大 多 是 用 几 大 公司 的 开源 编程 框架 ， 例 如 谷歌 的 
TensorFlow 和 英 伟 达 的 GPU 或 者 市 场 上 的 云 计 算 服 务 。 技 术 高 度 同 质 
化 ， 没 有 任何 壁垒 。 就 像 当 年 任何 公司 都 说 自己 是 . com 公 司 一 样 。 那 
么 我 们 如 何 判断 一 家 AI 创业 公司 的 价值 呢 ? 首先 ， 应 该 看 是 否 能 够 拿 
到 别人 拿 不 到 的 数据 。 做 到 这 一 点 很 难 ， 你 能 拿 到 的 数据 别人 通常 也 
能 拿 到 。 如 果 不 能 独占 数据 ， 那 就 要 看 有 多 大 先 发 优 势 。 如 果 进 入 一 
个 行业 早 ， 通 过 快速 迭代 ， 让 自己 的 模型 在 这 个 行业 中 变 得 有 用 ， 就 
可 以 得 到 更 多 的 数据 和 资源 ， 后 进 者 即使 拿 到 同样 的 数据 ， 模 型 质量 
差 也 打 不 进去 。 其 次 ， 要 看 该 企业 对 所 进入 行业 的 独到 理解 和 业务 开 
发 、 落 地 能 力 。 当 然 如 果 能 够 针对 本 行业 在 算法 上 有 和 突破， 就 能 够 大 
大 提高 进入 壁垒 。 


AI 与 互联 网 的 三 个 区 别 


这 次 AI 创 新 浪潮 堪 比 互联 网 ， 但 是 AI 浪 漳 和 互联 网 浪潮 有 三 个 区 


第 一 个 区 别 是 AI 从 一 开始 就 要 颠 履 传统 行业 。 互 联网 1994 年 起 步 
时 从 经 济 的 边缘 开始 ， 和 传统 产业 似乎 一 点 关系 都 没有 ， 没 有 人 信 一 
个 网 站 能 干什么 。 互 联网 20 多 年 来 逐步 从 边缘 和 奏 食 中 心 ， 直 人 至 今日 影 
啊 每 个 行业 。 但 即使 是 今天 ， 互 联网 对 制造 业 、 农 业 、 建 筑 业 、 交 通 
运输 等 搬运 原子 的 行业 的 影响 也 局 限 在 媒体 和 和 营销 方面 ， 没 有 进入 制 
造 业 的 核心 。 而 AI 的 特点 是 从 第 一 天 起 就 从 传统 产业 中 心 爆炸 ， 目 动 
雪 驶 对 汽车 行业 的 颠 获 吏 是 一 个 典型 的 例子 。 


第 二 个 区 别 是 技术 驱动 。 互 联网 除了 搜索 以 外 基本 没有 太 多 技 
术 ， 主 要 是 应 用 和 商业 模式 。 互 联网 创业 者 完全 可 以 是 不 懂 技 术 的 
人 。 目 前 为 止 AI 创业 者 以 技术 大 拿 居多 。 当 然 随 着 AI 技术 的 普及 ， 许 
多 有 商业 头脑 的 人 只 要 看 明白 AI 在 一 个 行业 的 价值 也 可 以 拉 起 一 家 公 

司 ， 但 目前 最 稀缺 的 是 AI 的 高 级 技术 人 才 。 


第 三 个 区 别 是 可 能 不 会 出 现 平 台 性 公司 或 赢家 “ 通 吃 ”的 局 面 。 
互联 网 的 一 个 特点 是 连接 供需 双方 ， 一 旦 用 户 超 过 一 个 门限 ， 后 来 者 
就 很 难 赶 上 ， 所 以 很 容易 形成 赢家 “ 通 吃 ”的 局 面 。 但 在 AI 产业 里 目 
前 还 没有 看 到 这 样 的 机 会 ， 不 论 是 自动 驾驶 还 是 人 脸 识 别 都 是 一 个 一 
个 山头 去 攻 ， 无 法 在 短期 内 形成 垄断 。 造 成 融资 泡沫 的 一 个 重要 原因 
就 是 有 些 投资 人 还 以 为 AI 和 互联 网 一 样 赢家 “ 通 吃 ”: 只 要 投 中 第 一 
名 ， 多 贵 都 值 。 

简单 用 一 句 话 说 就 是 互联 网 是 to C( 对 用 户 ) 的 生意 ，AI 是 to 
B《〈 对 企业 ) 的 生意 。AI 中 to C 的 生意 都 会 被 现 有 互联 网 巨头 吸纳 ， 创 
业者 的 机 会 在 于 to B。 


第 五 草 


风 风 玫 来 一 一 将 航 题 履 的 行业 


导读 
本 章 探 讨 在 未 来 十 年 内 ， 人 工 智 能 将 给 哪些 商业 领域 带 来 翻 


天 履 地 的 变化 。 有 了 第 三 章 对 机 器 学 习 基 本 原理 的 了 解 ， 就 能 深 
刻 体 会 到 为 什么 机 器 学 习 将 造成 这 些 商 业 的 颠 履 。 但 即使 没 读 第 
三 章 也 完全 能 理解 本 章 。 


自动 驾驶 颠覆 出 行 一 一 10 万 亿美 元 的 产 
业 


人 工 镶 能 未 来 十 年 最 大 的 市 场 之 一 就 是 通过 目 动 轨 驶 彻 确 匡 履 汽 
车 的 制造 、 销 售 、 本 地 出 行 和 物流 行业 。 


目 动 驾 驶 传 感 硕 


如 果 让 机 器 开车 ， 机 器 就 要 和 人 一 样 能 做 四 件 事 : 第 一 ， 感 知 : 
离 车 100 米 处 是 一 辆 大 卡车 还 是 过 街 天 桥 。 第 二 ， 判 断 : 马路 边 站 的 人 
是 要 抢 着 穿行 还 是 在 等 我 的 车 过 去 。 第 三 ， 规 划 : 什么 时 机 挤 进 边 上 
的 车 流 中 去 。 第 四 ， 控 制 为 了 实现 规划 ， 如 何 控制 方向 盘 的 角度 和 
车 速 。 以 上 四 点 除了 控制 是 成 熟 技 术 以 外 ， 其 他 三 点 都 还 在 拐点 上 。 
图 5. 1 是 一 辆 目 动 驾 驶 汽车 的 感知 系统 。 


第 一 个 重要 的 传感器 就 是 摄像 头 。 摄 像 头 由 于 受到 像 系 的 限制 ， 
只 能 看 清 前 面 几 十 米 ， 但 也 能 分 辨 不 同 的 物体 。 摄 像 头 还 能 够 做 到 其 
他 所 有 传感器 都 做 不 到 的 :识别 交通 标志 。 摄 像 头 是 目前 最 成 熟 的 传 
感 器 ， 也 是 最 便宜 的 传 感 顺 。 但 是 从 摄像 头 里 识别 物体 和 标志 并 不 容 
易 。 摄 像 头 的 弱 操 是 看 不 远 ， 尤 其 是 遇 到 雨 、 雪 、 雾 多 天 气 时 ， 摄 像 
头 就 不 行 了 。 能 够 弥补 摄像 头 弱 点 的 吃 一 个 传 感 句 是 坚 米 波 雷 达 。 军 
米 波 雷达 可 以 看 清 200 300 米 甚至 更 远 的 距离 ， 不 受 日 光 和 天 气 影响 ， 
还 能 精确 测量 物体 的 距离 和 速度 。 但 现 有 的 坚 米 波 雷 达 的 空间 分 辨 率 
很 低 ， 也 就 是 虽然 知道 200 米 处 有 一 个 物体 在 以 每 小 时 50 千 米 的 速度 移 
动 ， 但 错 不 清 是 摩托 车 还 是 汽车 。 如 果 结 合 雷 达 和 摄像 尖 的 数据 ， 束 
可 以 更 准确 地 检测 和 跟踪 目标 。 当 一 个 物体 在 距离 200 米 处 时 ， 该 物体 
在 摄像 头 里 还 是 一 个 黑 点 ， 但 是 可 以 根据 相应 的 雷达 数据 获得 该 物体 
的 距离 和 移动 速度 。 等 物体 稍微 近 点 ， 摄 像 头 束 可 以 看 清 这 个 时 速 为 
50 干 米 的 物体 是 一 辆 摩托 车 。 摄 像 头 + 坚 米 波 雷 达 是 半自动 和 目 动 要 驶 
车 辆 最 基本 的 配置 〈 少 了 任何 一 个 都 不 行 ) ， 也 是 目前 〈2018 年 ) 特 
斯 拉 所 有 车 型 的 标准 配置 。 


激光 雷达 旋转 
360° 检 测 车 辆 处 理 器 读 取 数据 
周围 物体 pr 并 调节 车 辆 行为 


雷达 测量 前 
方 车 辆 速度 


方向 传感器 ， 载 传 感 另 
跟踪 车 的 移 次 
动 和 平衡 决定 移动 距离 


图 5.1 自 动 轰 驶 汽车 所 需 的 传感器 


图 片 来 源 : https://insideevs. com/googles-self-driving-cars-ready-road- 
video/。 


传统 毫米 波 雷 达 的 主要 问题 是 空间 分 辨 紊 太 低 。 解 决 这 个 问题 有 
两 种 办 法 。 一 种 办 法 是 将 单一 天 线 变 成 一 组 天 线 (4 个 、8 个 、16 个 
等 ) ， 天 线 越 多 ， 多 个 天 线 合成 的 空间 分 辩 率 就 越 高 ， 但 是 天 线 多 体 
积 也 随 之 变 大 ， 不 容易 安装 。 另 外 一 种 办 法 是 利用 汽车 移动 或 信号 变 
化 做 出 “虚拟 天 线 阵列 ”。 后 者 对 技术 要 求 很 高 ， 必 须 建立 在 对 雷达 
成 像 的 深度 理解 之 上 ， 并 且 需 要 许多 年 的 设计 经 验 。 美 国 的 0culii 公 
司 已 经 研发 出 776Hz 的 高 分 辩 率 点 云 成 像 雷 达 。 图 5. 2 就 是 这 个 雷达 产 
生 的 点 云 数据 ， 已 经 和 市 面 上 的 中 低 精 度 激 光 雷 达 可 比 。 如 果 暑 米 波 
雷达 能 够 达到 高 分 辨 率 ， 一 辆 自动 驾驶 汽车 只 要 摄像 头 和 毫米 波 雷 达 
就 足够 了 。 


图 5.2 美 国富 米 波 雷 达 公 司 Oculii 成 像 雷达 产生 的 周围 环境 点 云图 
图 片 来 源 : 美国 0culii 公 司 。 
在 自动 驾驶 行业 里 ， 许 多 人 认为 全 目 动 驾驶 汽车 必须 精确 知道 周 


围 环境 里 的 物体 和 距离 。 激 光 雷 达 是 许多 三 商都 在 试验 的 精准 传 感 
器 。 激 光 雷 达 在 本 质 上 就 是 一 个 三 维 照 相机 。 三 维 相片 上 的 每 一 个 物 
体 、 每 一 个 像素 的 距离 都 能 精确 到 厘米 级 。 这 种 三 维 照片 的 像素 集合 
也 被 称 为 “点 云 ”。 图 5. 3 就 是 斯 坦 福 大 学 棕榈 大 道 的 激光 雷达 三 维 点 
云 。 这 张 图 上 有 每 一 个 点 到 测量 激光 雷达 的 距离 。 


油光 雷达 晚上 的 效果 比 白 天 还 好 ， 因 为 没有 阳光 的 干扰 。 但 与 摄 
像 头 类 似 ， 它 的 问题 是 当 遇 到 雨 雪 雾 狂 天 气 时 罕 透 距离 会 大 大 下 降 。 
另外 一 个 问题 是 到 目前 为 止 它 的 成 本 仍然 很 高 。 目 前 市 场 上 唯一 在 销 
售 的 Velodyne 128 线 激光 雷达 (垂直 空间 分 辨 京 只 有 128 线 ， 电 视 机 是 
1 024 线 ， 这 已 经 是 目前 在 售 激光 雷达 的 最 高 分 辨 率 ) 的 零售 价格 为 7 
万 8 万 美元 一 台 《〈 一 个 毫米 波 雷 达 价 格 不 到 500 美 元 ) ， 相 当 于 两 三 辆 
中 档 汽 车 的 价格 。 很 显然 ， 这 种 价格 只 能 用 于 少量 的 测试 车 辆 。 许 多 
厂商 都 在 努力 降低 成 本 ， 目 前 世界 上 有 60 多 家 企业 在 研制 激光 雷达 ， 
它们 的 技术 路 线 大 致 分 为 三 类 。 
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图 5.3 高 分 辩 率 激光 雷达 点 云 


图 片 来 源 : https://techcrunch. com/2018/04/12/luminar-puts-its-|idar-tech-- 
into-productionthrough-acquisitions-and-smart-engineer ing/。 


1. 机 械 扫描 式 激光 雷达 
我 们 看 到 的 谷歌 和 百度 自动 驾驶 车 辆 头 项 上 项 的 “ 花 盆 ” 就 是 机 
械 扫描 式 激光 雷达 ， 这 也 是 目前 市 面 上 少数 几 种 可 用 的 激光 雷达 。 


图 5. 4 是 美国 Velodyne 公 司 的 三 种 激光 雷达 ， 从 左 至 右 分 别 为 64 
线 、32 线 和 16 线 。 


HDL-64E HDL-32E 


图 5.4 美 国 Velodyne 公 司 的 激光 雷达 产品 
图 片 来 源 : http://velodynelidar. com/products. html。 

64 线 激光 雷达 里 面 有 64 对 垂直 排列 的 激光 发 射 管 和 光学 接收 颖 。 
整个 激光 雷达 在 水 平方 向 上 做 360” 旋转 。 在 旋转 时 ，64 个 发 射 管 按 照 
一 定 的 顺序 依次 发 射 短 激光 脉冲 ， 激 光 脉 冲 从 远 处 物体 反射 回来 后 被 
相应 发 射 管 的 光学 接收 器 收 到 ， 此 时 该 物体 的 距离 =c x 了， 这 里 c 是 光 
速 ，T 是 脉冲 往返 时 间 。 如 果 这 部 64 线 激光 雷达 每 秒 转 20 圈 ， 每 水 平角 
度 整个 64 线 激光 发 射 三 次 《角度 分 辨 率 为 1/3 度 ) ， 每 秒 就 会 产生 
20X3X360X64=1 382 400 点 数据 。 把 这 些 融 有 距离 和 方位 的 三 维 空 
间 点 全 部 夯 出 来 就 是 如 图 5. 3 所 示 的 “点 云 ”。 这 种 机 械 扫描 式 激 光 雷 
达 有 两 个 缺点 : 第 一 是 机 械 容易 损坏 ， 特 别 是 车 载 、 展 动 、 局 温 、 漳 
湿 等 对 机 械 部 分 危害 很 大 。 第 二 是 装配 时 需要 很 多 手工 调试 ， 成 本 很 
高 。 许 多 公司 在 研发 时 不 用 或 少 用 机 械 部 件 。 完 全 没有 机 械 部 件 的 激 
光 雷 达 也 叫 固态 激光 雷达 。 


2. 固态 激光 雷达 


回 态 激光 雷达 有 两 种 做 法 ， 一 种 做 法 是 通过 控制 不 同 的 几 束 激光 
相位 (“相位 ”即时 间 延 人 运 〉 让 它们 形成 一 束 肾 焦 的 激光 在 空间 扫 
描 ; 男 一 种 做 法 是 用 激光 发 揣 占 点 阵 。 前 者 技术 复杂 ， 控 制 激光 相位 
对 温度 敏感 ， 在 汽车 行驶 环境 极端 的 情况 下 ， 激 光 雷 达 性 能 不 容易 稳 
定 。 后 者 需要 大 量 诉 光 发 射 器 ， 例 如 一 个 100X100 的 氮 阵 就 需要 10 
000 个 激光 发 射 管 。 固 态 激光 雷达 还 有 一 个 问题 是 只 能 照射 一 个 方 问 ， 
所 以 在 一 辆 车 上 要 看 到 全 方位 的 情况 ， 人 至 少 要 4 个 油光 雷达 分 别 装 在 车 
的 四 个 面 上 。 

回 态 激光 雷达 中 还 有 一 种 “内 光 激 光 雷 达 ”， 它 的 原理 和 闪光 灯 
照相 类 似 。 只 用 一 个 激光 管 ， 肥 和 冉 出 一 个 脉冲 面 光 源 把 前 方 一 大 片 空 
间 都 照 融 ， 接 收 絮 类似 数 字 相 机 里 面 的 感光 阵列 蕊 请 ， 只 不 过 这 种 沪 
片 在 像素 感光 的 同时 ， 可 以 记录 每 一 个 像素 收 到 脉冲 的 时 间 ， 因 此 能 
测 出 这 个 像素 对 应 的 空间 点 的 距离 。 这 种 闪光 激光 雷达 成 本 最 低 ， 但 
征 由 于 发 射 能 量 分 散 ， 所 以 要 照 亮 一 大 片 ， 成 像 距离 很 短 〈 十 几米 到 
J 


3. 微机 械 扫描 激光 雷达 


介 于 机 械 扫 描 式 激光 雷达 和 固态 激光 雷达 之 间 的 是 一 种 微机 械 扫 
描 激光 雷达 。 这 种 激光 雷达 是 用 半导体 心 片上 的 微机 电器 件 (Micro- 
Electronic-Mechanical-System，MEMS ) 。 微 机电 器件 的 原理 是 在 半 
导体 材料 上 刻 蚀 出 微小 的 机 械 镜 面 ， 用 电 可 以 控制 镜面 的 摆动 。 把 激 
光 射 到 镜面 上 ， 当 镜面 摆动 时 就 可 以 扫描 一 定 的 空间 范围 。 图 5. 5 就 是 
MEMS 镜 面 的 示意 图 。 但 这 种 镜面 的 转动 角度 有 限 ， 所 以 激光 雷达 前 方 
能 照射 的 角度 仍然 受 限 。 


图 5.5 在 半导体 材料 上 刻 蚀 出 来 的 微机 电镜 面 放大 图 

图 片 来 源 : http://www. preciseley. com/technology. html 。 

目前 还 没有 一 种 激光 雷达 既 能 够 达到 距离 足够 远 (200 300 米 ) ， 
同时 分 辨 率 和 可 笔 性 也 足够 高 ， 而 且 价格 便宜 《〈 几 百 美 元 ) 。 如 采 室 
米 波 雷 达 可 以 在 远 距 离 达 到 足够 高 的 分 辨 率 ， 那 么 激光 雷达 只 要 用 于 
近 距 离 精 确 测量 即 可 ， 这 样 成 本 最 低 ， 没 有 任何 机 械 部 件 的 内 光 式 激 
光 雷 达 将 足以 敷 用。 

除了 摄像 头 、 军 米 波 雷达 和 激光 雷达 这 三 个 传感器 之 外 ， 几 乎 所 
有 半自动 和 上 自动 获 驶 的 车 都 用 声呐 。 声 呐 能 探测 的 距离 很 近 ， 只 有 几 
米 ， 主 要 用 于 停车 、 倒 车 时 的 防 撞 提 醒 。 一 个 车 用 声呐 只 要 几 美 元 ， 
一 辆 车 会 沿 着 底盘 放 十 几 个 声呐 。 

全 目 动 区 驶 还 要 使 用 GPS “全球 定 位 系统 ) 。 通 常 手机 和 车 里 用 于 
地 图 的 GPS 的 精度 在 15 米 左右 。 这 样 的 精度 做 上 自动 驾驶 和 防 撞 都 不 够 。 
所 以 用 于 自动 驾驶 的 GPS 是 可 以 做 到 10 厘 米 高 精度 的 “差分 OPS”。 郑 
分 GPS 系统 在 地 面 设 一 些 固定 的 校准 基站 《不 需要 像 移动 电话 基站 那么 
密集 ， 每 隔 几 十 干 米 甚至 几 百 干 米 一 个 即 可 )〉。 这 些 点 的 精确 坐标 已 
知 。 把 这 些 点 上 用 普通 6PS 测 量 出 的 坐标 和 已 知 华 标 相 比 较 就 会 知道 
GPS 的 误差 ， 把 这 个 误差 通过 无 线 频 道 ( 例 如 手机 信号 ) 传 给 附近 的 
GPS 接 收 机 ， 让 大 家 都 修正 这 个 误差 。 这 种 高 精度 的 差分 GPS 可 以 让 汽 


车 知道 自己 在 哪 条 线 道 上 ， 是 否 人 往 离 了 线 道 的 中 心 。 差 分 GPS 过 去 主要 
用 于 航空 和 测量 ， 每 台 差 分 GPS 的 价格 高 达 几 万 美元 。 目 前 也 有 硅谷 创 
业 公 司 如 Polynesian Exploration 等 在 研发 用 于 自动 驾驶 的 低 成 本 差 
分 GPS 。 


目 动 驾 驶 分 级 


此 前 ， 自 动 驾 驶 的 自动 化 程度 分 级 有 两 个 标准 。 美 国 交 通 部 下 辖 
的 美国 国家 公路 交通 安全 管理 局 (NHTSA〉 在 2013 年 率先 发 布 了 自动 驾 
驶 汽车 的 分 级 标准 ， 其 对 自动 化 的 描述 共有 4 个 级 别 。 到 2014 年 ， 世 界 
汽车 工程 师 协会 (SAE) 也 推出 了 一 套 自动 杨 号 驶 沪 车 分 级 标准 ， 其 对 自 
动 化 的 描述 分 为 5 个 等 级 。2016 年 9 月 20 日 ， 美 国 交 通 部 发 布 的 针对 自 
动 敬 驶 汽车 的 首 项 联邦 指导 方针 中 放弃 了 NHTSA 之 前 提出 的 分 级 标准 ， 
宣布 将 采用 在 世界 范围 应 用 更 加 广泛 的 SAE 分 级 标准 ， 这 代表 SAE 的 5 级 
标准 基本 成 为 行业 共识 。 自 动 当 驶 根据 自动 程度 目前 被 分 为 以 下 5 个 级 
别 。 


驾驶 辅助 ， 对 方 同 盘 和 加 减速 中 的 一 项 操作 提供 驾驶 支持 ， 
i 紧急 目 动 蕴 车 等 。 其 他 的 驾驶 动作 都 由 人 类 驾驶 员 进 
行 操作 。 在 这 个 阶段 ， 汽 车 主要 实现 了 一 些 预警 类 功能 ， 当 汽车 过 到 
紧急 情况 时 ， 汽 车 发 出 警告 信号 ， 例 如 车 道 俩 离 了 预警 、 碰撞 预警 、 陡 
点 监测 等 。 目 前 这 些 功 能 已 经 被 广泛 应 用 到 现在 的 汽车 上 。 


: 部 分 自动 化 ， 通 过 要 驶 环境 对 方 问 盘 和 加 减速 中 的 多 项 操作 
0 其 他 的 驾驶 动作 都 由 人 类 驾驶 员 进 行 操作 。 在 该 阶 
段 ， 汽 车 已 经 具备 一 些 自 主 决策 和 执行 的 能 力 ， 例 如 自 适 应 巡航 、 车 
道 线 保持 、 紧 和 急 莘 车 、 上 自动 泊 车 等 。 目 前 特 斯 拉 的 “AutoPilot” 辅 助 
轨 驶 系统 就 达到 了 L2 级 别 。 


L3: 有 条 件 上 自动 化 ， 由 上 自动 驾驶 系统 完成 所 有 的 驾驶 操作 。 根 据 
系统 要 求 ， 人 类 驾驶 员 提 供 恰当 的 应 答 。 主 要 实现 的 功能 为 自动 加 


速 、 目 动 判 车 、 上 自动 转身、 编队 行驶 、 汇 入 车 流 、 主 动 避 障 等 。 在 L2 
的 基础 上 增加 识别 交通 标 产 、 红 绿灯 、 目 动 转 过， 可 以 判断 简单 的 交 
通 苋 争 状 况 例 如 两 辆 车 同时 到 达 十 字 路 口 停车 线 ) 等 功能 。 轨 驶 员 
无 须 一 直 监 视 行 驶 ， 但 复杂 情况 仍 需 准备 接管 。 

L4: 高 度 自动 化 ， 由 自动 驾驶 系统 完成 所 有 的 轰 驶 操作 。 根 据 系 
统 要 求 ， 人 类 要 驶 员 不 一 定 需要 对 所 有 的 系统 请 求 做 出 应 答 ， 也 不 限 
定 道路 和 环境 条 件 等 ， 除 了 特定 的 天 气 和 路 段 ， 汽 车 在 大 多 数 场景 下 
能 够 自动 区 驶 。 

L5: 完全 目 动 化 ， 在 所 有 人 类 驾驶 员 可 以 应 付 的 道路 和 环境 条 件 
下 ， 均 可 以 由 自动 驾驶 系统 自主 完成 所 有 的 驾驶 操作 。 和 车 辆 在 全 天 
候 、 全 场景 下 都 能 够 实现 自动 驾驶 ， 无 须 人 的 介入 。 

读者 可 能 发 现 上 面 的 定义 有 很 多 模糊 之 处 ， 各 层级 的 功能 似乎 也 
有 很 多 重合 ， 笔 者 在 这 里 尝试 给 出 一 个 更 为 人 简单 清晰 的 定义 。 

Ll1: 人 全 程 负责 驾驶 ， 有 某 个 单项 的 机 器 上 自主 功能 ， 例 如 目 动 紧 
总 判 车 。 


L2: 仍然 是 人 全 程 负责 驾驶 ， 但 在 限定 条 件 下 可 以 由 机 器 驾驶 几 
十 秒 到 几 分 钟 “ 例 如 在 线 道 清晰 的 高 速 公路 上 四 驶 员 手 离开 方 癌 盘 ， 
眼睛 不 看 路 ， 脚 不 放 在 刹车 上 的 时 间 不 超过 几 分 钟 ) 。 有 多 项 机 器 目 
主 功能 同时 使 用 ， 例 如 自动 巡航 和 线 道 保 持 同 时 用 ， 驾 驶 体验 比 L1 轻 
松 很 多 。 

L3: 要 驶 过 程 可 以 明确 分 为 两 种 不 同 的 时 间 段 : 人 负责 驾驶 的 时 
间 段 和 机 器 负责 的 时 间 段 。 当 机 器 负责 轨 驶 时 ， 人 可 以 手 离开 方 问 
盘 ， 眼 睛 不 看 路 ， 脚 离开 刹车 。 当 遇 到 情况 时 ， 机 器 会 请 求 甚至 强制 
人 接管 区 驶 。 目 前 市 场 上 还 没有 任何 一 个 量 产 的 L3 乘 用 车 。 


L4: 机 器 驾驶 时 间 达 到 95% 以 上 ， 但 仍然 不 时 有 特殊 情况 需要 人 
接管 。 


L5: 机 器 驾驶 时 间 100%。 即 车 里 不 再 需要 方 同 盘 、 判 车 、 油 门 


有 
等 。 


自动 驾驶 上 分 为 两 大 技术 流派 : 演进 派 和 激进 派 。 演 进 派 认为 自 
动 驾驶 不 可 能 一 路 而 就 ， 必 须 一 步 一 步 循 序 渐进 。 演 进 派 豆 括 了 所 有 
的 汽车 制造 商 ， 包 括 新 进入 的 “互联 网 造 车 ”或 “新 势力 造 车 ” 广 
商 。 原 因 很 简单 ， 它 们 每 年 都 要 造 和 卖 大 量 的 车 ， 只 能 是 什么 技术 成 
测 束 安装 什么 技术 。 截 殖 2018 年 ， 只 有 少数 在 售 的 汽车 有 L2 功 能 ， 例 
如 特 斯 拉 、Audi A8 和 奔驰 公司 E 级 车 型 等 。 目 前 全 世界 几乎 所 有 的 大 
汽车 广 商 和 一 级 供应 商都 在 紧张 研究 自动 当 驶 ， 但 它们 打算 推出 的 未 
来 新 车 主要 集中 在 L2 或 L3 级 别 。 

激进 派 的 代表 是 谷歌 的 自动 驾驶 公司 Waymo， 谷 歌 的 实验 车 根本 没 
有 方 回 盘 。 这 一 派 认为 L2 和 13 很 危险 ， 什 么 时 候 该 人 管 ， 什 么 时 候 该 
机 器 管 不 仅 很 难 分 清 ， 而 且 两 者 之 间 的 切换 也 会 产生 问题 (例如 人 打 
虹 儿 睡 着 了 叫 不 醒 〉 ， 一 步 到 位 全 让 机 器 开车 反而 安全 。 全 自动 流派 
因为 目前 并 不 造 车 卖 车 ， 所 以 它们 只 对 未 来 感 兴趣 。 男 一 个 重要 原因 
是 它们 要 想 颠 履行 业 ， 就 必须 做 目前 车 三 做 不 了 的 。 


演进 派 的 优势 是 它们 的 车 不 断 地 给 用 户 提 供 新 的 功能 和 价值 ， 一 
直 从 技术 上 获 益 。 演 进 派 的 风险 是 如 果 激 进 派 的 全 上 自动 驾驶 成 功 了 ， 
将 会 题 履 整个 行业 。 所 以 演进 派 ， 特 别 是 一 流 大 车 广 都 同时 在 做 全 目 
动 朗 驶 的 研究 。 诉 进 派 的 优势 是 专注 于 全 自动， 它们 成 功 会 比 演进 铂 
早 ， 一旦 成 功 就 会 让 演进 派 无 路 可 走 。 激 进 派 的 风险 是 如 果实 现 全 目 
动 很 困难 ， 它 们 就 会 长 期 投入 而 没有 收入 ， 时 间 太 长 哪 家 公司 痢 打 不 
人 


L4 和 L5 全 自动 驾驶 又 有 两 条 不 同 的 技术 路 线 : 一 条 是 基于 高 精度 
地 图 和 精准 定位 ， 劝 一 条 是 无 须 高 精度 地 图 。 基 于 高 精度 地 图 需要 两 
个 条 件 : 第 一 是 所 要 驶 区 域 己 经 有 测量 好 的 高 精度 地 图 ， 第 二 是 车 上 
有 能 精准 测 距 或 定位 的 仪器 ， 例 如 激光 雷达 和 差分 GCPS。 做 到 第 一 点 需 
要 有 大 量 的 高 精度 地 图 测量 车 把 一 个 国家 内 的 所 有 行驶 道路 测量 出 


来 。 这 种 测量 通常 也 是 使 用 激光 雷达 加 上 差分 GPS。 但 测量 时 车 的 行驶 
速度 不 能 太 快 ， 大 约 为 时 速 50 千 米 ， 因 为 行驶 速度 会 影响 测量 精度 。 
有 人 估计 如 果 只 用 一 辆 测量 车 把 全 美国 的 高 精度 地 图 都 测量 完毕 需要 6 
000 年 的 时 间 (或 者 600 辆 车 用 十 年 时 间 )〉 。 由 于 地 图 的 精度 高 ， 数 据 
量 很 大 ， 所 以 汽车 里 只 能 存储 一 部 分 地 图 。 当 汽车 驶 出 车 内 存储 的 地 
图 范围 时 ， 需 要 有 很 宽 的 无 线 传输 带宽 不 断 将 新 区 域 的 高 精度 地 图 传 
给 汽车 。 依 赖 高 精度 地 图 还 有 一 个 巨大 的 挑战 是 路 况 和 路 障 的 实时 更 
新 。 这 种 实时 更 新 只 能 靠 “ 众 包 ” 的 方式 ， 即 靠 正 在 路 上 行驶 的 汽车 
收集 并 实时 上 传 到 云端 ， 且 实时 下 载 到 路 障 附 近 的 车 里 。 这 就 出 现 了 
-个 先 有 鸡 还 是 先 有 和 蛋 的 问题 : 一 开始 没有 几 辆 车 有 实时 数据 收集 的 
能 力 ， 这 样 就 没 人 敢 用 自动 驾驶 ， 没 人 敢 用 就 没有 数据 收集 。 

第 二 种 自动 驾驶 的 技术 路 线 不 依赖 于 高 精度 地 图 。 这 里 的 逻辑 是 
人 的 眼睛 不 能 精确 测量 周围 物体 的 距离 ， 为 什么 非 要 每 一 点 像素 的 距 
离 ? 有 一 个 大 概 即 可 。 这 种 方案 的 最 大 优势 是 不 依赖 于 不 知道 什么 时 
候 才 能 有 的 高 精度 地 图 ， 成 本 很 低 。 但 坚持 高 精度 地 图 技术 路 线 的 人 
批评 说 ， 高 精度 地 图 方案 可 以 保证 99. 9999% 的 安全 性 ， 而 没有 高 精度 
地 图 也 许 只 能 保证 99% 的 安全 性 。 但 即使 是 1% 的 错误 也 是 致命 的 。 

有 了 之 前 介绍 的 那些 传感器 汽车 就 相当 于 有 了 眼睛 。 但 是 人 类 视 
觉 不 光 是 眼睛 ， 还 包括 脑 神经 对 接收 信号 的 识别 和 判断 。 上 自动 驾驶 软 
件 的 核心 就 是 识别 和 判断 。 一 辆 车 的 传感器 有 很 多 ， 第 一 个 挑战 是 要 
把 这 些 传感器 传 进来 的 信号 融合 起 来 。 融 合 的 主要 任务 是 要 把 不 同 传 
感 器 探测 到 的 物体 一 一 对 应 起 来 。 例 如 毫米 波 雷 达 发 现 了 一 个 物体 ， 
要 在 摄像 头 的 视频 中 把 这 个 物体 找 出 来 。 当 各 个 传感器 探测 到 的 物体 
很 多 ， 又 要 在 极 短 的 时 间 里 把 所 有 物体 都 识别 并 对 应 起 来 时 ， 融 合 就 
变 得 不 那么 简单 了 。 

自动 驾驶 软件 的 第 二 个 挑战 是 要 处 理 大 量 的 数据 。 我 们 前 面 算 
过 ， 一 个 64 线 激光 雷达 每 秒 钟 产生 130 万 个 三 维 数据 点 。 我 们 假设 使 用 
神经 网 络 来 识别 物体 ， 需 要 处 理 能 力 非 常 强 大 的 必 片 。 目 前 在 自动 轰 


驶 上 使 用 的 英 伟 达 Xavier 芯 片 《2016 年 9 月 发 布 ) 的 处 理 能 力 是 每 秒 20 
万 亿 次 运算 ， 功 耗 为 20 瓦 。 

自动 驾驶 软件 的 第 三 个 挑战 ， 也 即 迄 今 最 大 的 挑战 是 如 何 识别 和 
判断 各 种 复杂 情况 。 如 果 单 纯 使 用 机 器 学 习 的 方法 ， 需 要 训练 的 情形 
几乎 无 穷 多 ， 不 仅 无 法 收集 到 这 么 多 数据 ， 而 且 计 算 量 惊人 或 计算 成 
本 是 天 文 数字 。 目 前 的 自动 驾驶 软件 大 部 分 都 是 混合 式 的 ， 即 简单 的 
和 常见 的 情形 用 基于 规则 的 判断 ， 例 如 线 道 保持 、 上 自动 停车 、 遵 守 交 
通 规则 等 “目前 特 斯 拉 L2 功 能 主要 是 基于 规则 的 判断 》 。 非 常见 的 情 
形 可 以 用 机 器 学 习 。 


目 动 驾驶 软件 的 第 四 个 挑 成 是 如 何不 断 地 学 习 。 目 前 是 将 车 里 采 
集 的 数据 上 传 到 云 里 ， 在 云端 进行 训练 。 我 们 前 面 的 算法 部 分 提 到 
过 ， 目 前 的 机 器 学 习 一 旦 有 了 新 数据 ， 就 要 把 新 老 数据 放 在 一 起 重新 
训练 神经 网 络 ， 只 用 新 数据 来 改进 原 有 模型 的 “ 增 量 ”训练 方法 还 在 
研究 阶段 。 这 样 新 的 模型 就 要 经 过 大 量 测试 以 确保 万 无 一 失 。 

自动 驾驶 软件 的 第 五 个 挑战 是 如 何 个 性 化 。 目 前 的 驾驶 算法 在 所 
有 车 上 都 是 一 样 的 ， 和 很 多 人 的 驾驶 习惯 不 同 。 但 个 性 化 的 驾驶 算法 
需要 每 一 辆 车 的 模型 都 不 同 ， 个 性 化 区 驶 不 仅 需要 大 量 的 路 况 数据 ， 
还 需要 每 个 人 的 驾驶 习惯 数据 。 但 一 个 人 能 过 到 的 状况 有 限 ， 为 了 让 
汽车 足够 聪明 ， 需 要 许多 人 的 路 况 和 鸭 驶 数据 ， 如 何 能 够 学 到 其 他 人 
的 轨 驶 经 验 同 时 又 符合 上 自己 的 要 驶 习惯 是 一 个 两 难 问 题 。 


自动 驾驶 软件 的 第 六 个 挑战 是 如 何 学 习 和 道路 上 的 车 辆 博弈 。 人 
们 日 常 驾驶 并 不 总 是 严格 遵守 交通 规则 ， 许 多 情况 交规 里 面 也 没有 规 
定 。 在 世界 上 的 许多 地 方 ， 如 果 严格 遵守 交通 规则 驾驶 ， 那 么 汽车 可 
能 寸步 难 行 ， 此 时 驾驶 软件 该 如 何 办 ? 一 种 可 行 的 方法 就 是 “ 随 大 
流 ”， 这 就 要 求 机 器 能 学 习 各 地 的 “驾驶 文化 ”。 这 种 博弈 学 习 同 样 
需要 模型 有 “连续 学 习 ” 和 “ 增 量 学 习 ” 的 能 


一 套 日 动车 驶 软件 大 致 由 下 列 几 个 模块 组 成 。 


(1) 感知 和 数据 融合 。 

(2) 物体 检测 、 分 类 、 跟 踪 。 

(3) 场景 识别 和 判断 。 

(4) 路 径 规 划 。 

(5) 控制 (方向 、 速 度 、 刹 车 等 ) 。 


电动 车 和 目 动 驾驶 


和 自动 驾驶 几乎 同步 成 为 未 来 趋势 的 是 电池 动力 汽车 。 电 动车 的 
控制 反应 时 间 (加 速 减速 等 ) 比 汽油 车 要 短 得 多 。 例 如 汽油 发 动机 把 
油门 断 掉 ， 喷 入 汽缸 的 汽油 还 会 继续 燃烧 一 小 段 时 间 ， 而 电动 车 马达 
一 断 电 马上 就 没有 动力 。 电 动 化 也 能 更 好 地 支撑 自动 化 程度 的 不 断 提 
高 。 汽 车 自动 化 过 程 需要 识别 、 接 收 和 处 理 大 量 复杂 的 信息 ， 不 仅 需 
要 数量 庞大 的 传感器 、 控 制 器 、 芯 片 等 硬件 支撑 ， 同 时 也 需要 实时 对 
数据 进行 传输 、 存 储 和 计算 。 这 一 系列 复杂 的 过 程 需要 足够 多 的 电能 
作为 支撑 。 电 子 产 品 配 置 增多 ， 耗 电量 越 大 ， 需 要 的 电池 容量 越 大 。 
电动 化 和 自动 化 这 两 者 结合 的 典型 代表 就 是 特 斯 拉 的 具有 辅助 芍 驶 功 
能 的 S 型 轿车 和 X 型 SUV (运动 型 实用 汽车 〉。 


电动 汽车 曾经 面临 的 第 一 个 问题 是 巡航 里 程 数 。 美 国 87% 的 汽车 每 
天 驾驶 距离 不 会 超过 117 千 米 ，2017 年 美国 最 便宜 的 电动 车 巡航 里 程 已 
经 达到 200 千 米 。 电 动车 巡航 里 程 已 经 能 够 完全 满足 绝 大 部 分 人 日 常 本 
地 活动 和 上 下 班 的 需求 ，“ 电 池 焦 虑 ”问题 已 经 大 大 绥 解 。 特 斯 拉 S 型 
轿车 的 最 高 巡航 里 程 已 经 达到 每 次 充电 行驶 500 千 米 。 过 去 锂电 池 技 术 
的 发 展 是 每 十 年 容量 翻番 ， 也 就 是 说 ， 在 没有 大 的 技术 突破 的 情况 
下 ， 十 年 后 同等 体积 或 重量 的 电池 可 以 达到 每 次 充电 行驶 1 000 千 米 。 

目前 汽车 电池 的 最 大 问题 是 充电 时 间 。 特 斯 拉 的 “超级 充电 桩 ” 
代表 目前 大 规模 商用 电动 汽车 中 最 快 的 充电 时 间 ， 从 堆 到 充满 需要 


75 90 分 钟 〈 根 据 电池 容量 大 小 ) ， 这 成 为 目前 电动 车 无 法 出 远门 的 主 
要 障碍 。 只 有 把 充电 时 间 缩 短 到 和 汽油 车 加 油 时 间 可 比 《〈5 10 分 钟 ) 
才能 彻底 解决 出 远门 的 问题 。 目 前 美国 和 以 色 列 都 有 创业 公司 在 研发 
快速 充电 电池 和 材料 ， 如 硅谷 的 新 创 公 司 Gru Energy Lab 等 。 


电动 汽车 的 第 二 个 问题 是 电池 成 本 。2018 年 锂电 池 的 成 本 约 为 200 
美元 /千瓦 时 ， 一 辆 能 够 巡航 约 338 干 米 的 特 斯 拉 S-60 型 电池 成 本 约 为 
200X60=12 000 美 元 ， 电 池 成 本 约 占 整个 车 的 1/5。 所 以 同等 档次 的 电 
动车 要 比 汽油 车 出 广 价 格 贵 。 但 在 驾驶 过 程 中 由 于 充电 费用 是 汽油 的 
1/3， 所 以 这 个 出 厂 成 本 差额 可 以 在 汽车 整个 寿命 期 间 内 补 平 。 轩 如 
图 5. 6 所 示 ， 预 计 锂 电池 的 成 本 在 2020 年 会 降 到 100 美 元 / 千瓦 时 ， 这 
时 一 辆 电动 汽车 的 成 本 就 将 相当 于 一 部 同 档次 的 汽油 车 成 本 (因为 电 
动车 除了 电池 这 个 额外 成 本 ， 其 他 成 本 和 汽油 车 相 比 大 幅 下 降 ， 比 如 
没有 汽油 发 动机 和 变速 箱 等 ， 电 子 控制 也 更 简单 ) 。 这 个 时 点 将 成 为 
电动 车 的 爆发 点 ， 因 为 行驶 寿命 期 间 节 约 的 油 费 将 成 为 用 户 的 净 收 
益 。 如 果 今 后 十 年 电池 成 本 继续 按 这 个 速度 下 降 ， 十 年 后 电池 成 本 只 
占 到 整 车 成 本 的 1/50， 几 乎 可 以 忽略 不 计 。 电 池 成 本 的 下 降 也 意味 着 
巡航 里 程 数 的 增加 ， 当 电池 只 占 到 整 车 成 本 的 1/50 时 ， 用 户 可 以 选择 
增加 1/50 的 成 本 来 增加 巡航 里 程 。 


电池 成 本 在 电动 车 部 件 中 排名 第 三 位 
电池 成 本 持续 下 降 ， 将 驱动 电动 车 需求 的 不 断 上 升 
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图 5.6 锂 电池 成 本 下 降 趋 势 和 电动 车 对 电池 的 全 球 需 求 量 趋势 
图 片 来 源 : 彭 博 社 。 

即使 没有 目 动 驾驶 技术 ， 由 于 动力 电池 的 容量 增加 和 成 本 下 降 ， 
整个 汽车 行业 也 会 同 电动 汽车 大 规模 转型 。 但 电池 驱动 技术 将 使 汽车 
行业 的 新 进入 者 的 进入 门槛 大 大 降低 。 所 以 几乎 新 进入 者 全 部 是 造 电 
池 动 力 车 ， 而 且 新 进入 者 几乎 都 是 互联 网 厂商 ， 例 如 谷歌 、 百 度 或 者 
电子 设备 厂商 苹果 、 华 为 等 。 相 比 于 传统 汽车 厂商 ， 在 传动 系统 上 ， 
电池 动力 几乎 让 新 进入 者 与 传统 厂商 处 在 同一 条 起 跑 线 上 ， 在 目 动 轰 
驶 技术 上 新 进入 者 往往 更 有 优势 。 

如 图 5.7 所 示 ， 一 辆 巡航 里 程 322 千 米 的 电动 车 成 本 在 2017 年 已 经 
低 于 一 辆 美国 汽油 车 的 均 价 ， 将 在 2030 年 左右 低 于 美国 新 车 的 最 低 价 
格 。 与 此 同时 ， 电 动车 销量 每 年 增长 达 30% 以 上 ， 全 球 保有 量 在 2033 
年 左右 将 超过 1 亿 辆 。 
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图 5.7 巡 航 322 干 米 的 电动 车 成 本 下 降 趋 势 


图 片 来 源 : https://www. nextbigfuture. com/2016/04/by-2030-electric- 
vehicles-with-200-mile. html。 


特 斯 拉 电 动车 证 明了 电动 车 未 来 的 巨大 商业 前 景 后 ， 几 乎 所 有 的 
主流 厂商 ， 包 括 过 去 认为 电动 车 不 可 能 成 功 的 三 商都 大 幅 调 高 未 来 电 
动车 的 占 比 ， 开 始 研 发 电动 车 新 型 号 。 仅 德国 大 众 一 家 厂商 就 宣布 到 
2025 年 生产 300 万 辆 多 达 30 个 不 同型 号 的 新 电动 车 。 中 国政 府 出 台 政 策 
要 求 电 动车 占 比 从 2017 年 的 8% 上 升 到 2020 年 的 12%。 如 果 2025 年 全 世界 
电动 车 占 比 达到 25%， 共 需要 1 500 千 兆 瓦 时 (GigaWatt-Hour ) 的 电 
池 ， 这 相当 于 要 建 40 个 目前 世界 最 大 的 在 内 华 达 州 的 特 斯 拉 电 池 厂 。 
按照 届时 100 美 元 /千瓦 时 计算 ， 光 汽车 所 需 电 池 行 业 每 年 的 产值 就 达 1 
500 亿 美元 。 如 果 加 上 储 能 、 换 电池 等 需求 ， 动 力 电 池 行 业 届 时 将 轻易 
成 为 一 个 数 千 亿美 元 的 产业 。 电 动车 对 电池 有 如 此 巨大 的 需求 ， 任 何 
电池 技术 的 突破 都 将 具有 巨大 的 商业 价值 。 


电动 汽车 本 身 将 形成 一 个 新 的 生态 系统 。 除 了 电池 《以 及 电池 行 
业 的 子 生态 包括 电池 正 负极 材 料 、 隔 膜 、 生 产 设备 、 原 料 矿石 、 电 池 
组 管理 软 人 硬件 等 ) ， 必 一 个 巨大 的 商业 机 会 是 充电 桩 和 充电 站 。 当 电 
动 汽车 保有 量 超过 汽车 的 10% 时 ， 就 将 需要 大 量 的 充电 桩 和 换 电 池 
站 。 目 前 每 个 充电 桩 设备 安装 成 本 大 约 为 5 000 美 元 。 当 世界 电动 汽车 
保有 量 达 一 亿 辆 时 ， 届 时 至 少 需要 100 万 个 公共 充电 桩 。 充 电 速 度 仍然 
是 电动 车 长 途 出 行 的 一 个 最 大 障碍 。 目 前 的 技术 进展 完全 有 可 能 在 未 
来 五 年 内 将 300 千 米 巡 航 充电 时 间 缠 短 到 10 分 钟 之 内 。 各 种 高 速 充电 设 
备 也 将 是 一 个 巨大 的 市 场 。 届 时 大 量 的 汽车 在 高 峰 时 间 高 速 充 电 将 对 
电网 造成 不 可 承受 的 负荷 。 电 网 的 改造 和 储 能 设备 的 商机 也 将 应 运 而 
生 。 除 此 之 外 ， 电 动 汽车 的 核心 部 件 之 一 是 高 速 、 高 扭矩 马达 。 谁 能 
率先 研发 出 低 成 本 高 性 能 的 马达 ， 谁 将 迅速 占领 世界 市 场 。 电 动车 的 
检修 与 汽油 车 完全 不 同 ， 检 修 设 备 和 修理 站 也 将 是 一 个 商业 机 会 。 


谁 是 明天 的 访 基 亚 


- 辆 自动 驾驶 汽车 的 核心 是 传感器 、 计 算 能 力 和 软件 。 自 动 驾驶 
汽车 实际 是 一 个 会 目 己 高 速 行走 的 机 器 人 。 汽 车 最 重要 的 零 部 件 将 是 
电子 元 件 ， 目 前 一 辆 车 中 各 类 半导体 心 片 成 本 大 约 500 美 元 ， 预 计 十 年 
后 一 辆 车 中 的 芯片 成 本 将 达到 5 000 美 元 。 一 辆 电动 自动 驾驶 车 本 质 上 
就 是 一 台 有 四 个 辕 办 的 电脑 。 传 统 汽车 的 核心 能 力 在 于 将 发 动机 、 传 
动 系统 等 机 械 子 系统 打磨 成 为 精密 的 工艺 品 。 但 一 夜 之 间 这 些 核心 技 
能 不 重要 甚至 不 再 被 需要 了 ， 例 如 目前 的 电动 汽车 的 马达 加 速 已 经 大 
大 超过 最 好 的 汽油 发 动机 ， 而 且 不 需要 任何 传动 系统 。 目 动 芝 驶 需要 
的 重要 技能 例如 计算 机 视觉 、 人 工 智 能 算法 等 都 不 是 传统 汽车 广 商 的 
强项 。 第 一 次 驾驶 特 斯 拉 半 自动 电动 车 的 感觉 就 像 第 一 次 使 用 iPhone 
手机 ， 而 获 驶 传统 汽车 就 像 使 用 诺基亚 手机 。 传 统 汽车 厂商 的 营销 渠 
道 非常 “ 线 下 ”， 依 托 于 成 本 巨大 的 经 销 丙 、 专 卖 店 和 维修 体系 。 电 
动车 的 车 体 束 是 三 样 东 西 ， 电 池 、 辐 纺 和 马达 。 一 辆 内 燃 友 动机 汽车 


的 零件 有 上 万 个 ， 而 一 辆 电动 车 的 机 械 零件 只 有 几 干 个 。 这 意味 着 发 
生机 械 故 障 的 概率 和 维修 成 本 的 降低 。 由 于 零 部 件 的 减少 ， 电 动车 和 
电脑 、 家 电 一 样 将 会 变 得 标准 化 。 这 使 电动 车 更 易于 在 线 销售 ， 这 将 
又 一 次 冲击 传统 汽车 广 两 。 


谁 胜出 ? 撒 特 律 还 是 硅谷 


传统 汽车 广 商 并 非 坐 以 待 毙 ， 几 乎 所 有 的 整 车 广 商都 在 投 巨 资 研 
发 电动 车 和 目 动 驾驶 技术 。 通 用 汽车 和 福特 都 巨 资 收购 了 上 自动 区 驶 软 
件 公 司 ， 丰 田 在 斯 坦 福 大 学 劳 边 斥 资 10 亿 美元 打造 自动 驾驶 研发 中 
心 ， 奔 驰 、 大 众 等 欧 系 车 三 也 是 全 力 以 赴 。 传 统 汽车 厂商 仍然 有 许多 
新 进入 者 不 具备 的 能 力 。 第 一 个 能 力 是 大 规模 生产 制造 能 力 。 这 是 一 
个 设备 和 资金 密集 型 行业 ， 很 难 简单 地 通过 代 工 生产 解决 《世界 的 主 
要 代 工 广 商 例如 富士 康 目前 代 工 的 主要 是 电脑 手机 类 产品 ， 世 界 上 并 
没有 成 熟 的 汽车 代 工 厂商 ， 这 也 许 是 一 个 商机 〉 。 目 前 全 世界 汽车 生 
产 线 的 产能 过 剩 ， 新 进入 者 完全 可 以 收购 一 条 生产 线 ， 但 仍然 面临 改 
造 生产 线 的 任务 。 传 统 汽车 厂商 的 第 二 个 能 力 是 供应 链 管 理 。 传 统 汽 
车 厂商 对 市 场 需求 有 长 期 经 验 ， 对 库存 和 供应 链 省 理 已 经 达到 精细 化 
程度 ， 这 两 个 拉 能 可 以 把 库存 风险 降 至 最 低 。 互 联网 厂商 通常 没有 供 
应 链 管理 和 库存 风险 管理 经 验 ， 更 不 擅长 流动 资金 的 管理 和 运用 ， 稍 
有 不 慎 就 会 造成 重大 亏损 。 传 统 汽车 厂商 的 第 三 个 重要 能 力 是 汽车 设 
计 能 力 ， 攒 借 它 们 对 客户 和 市 场 的 多 年 理解 ， 以 及 在 设计 细节 《例如 
安全 性 等 ) 上 的 经 验 积累 ， 不 会 出 现 太 多 诸如 召回 之 类 的 风险 。 而 对 
于 第 一 次 造 车 的 广 丙 ， 难 免 有 芷 漏 ， 一 次 重大 召回 惑 可 能 置 公 司 于 死 
地 。 传 统 汽 车 广 商 的 第 四 个 能 力 是 对 线 下 经 销 商 的 管理 以 及 相应 的 个 
人 贷款 、 保 险 和 维修 体系 。 建 立 这 一 整套 体系 要 求 新 进入 者 投入 大 量 
的 资金 ， 招 收 大 量 传统 产业 管理 人 员 ， 并 且 需 要 相当 长 时 间 的 学 习 和 
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但 传统 汽车 广 商 的 最 大 软肋 就 是 软件 。 传 统 汽车 三 商 作 为 总 系统 
集成 商 ， 上 自己 基本 不 开发 软件 ， 它 们 的 任务 是 把 各 个 子 系统 的 软件 集 
成 到 一 起 ， 如 图 5. 8 所 示 。 传 统 汽车 广 商 的 软件 系统 集成 通常 会 出 现 两 
个 问题 : 第 一 个 问题 是 软件 模块 之 间 不 兼容 所 造成 的 程序 漏洞 。 由 于 
各 个 软件 模块 是 由 不 同 广 商 号 的 ， 源 代码 又 未 必 会 开 ， 所 以 集成 商 即 
使 发 现 漏洞 也 无 法 及 时 修复 ， 只 能 让 各 三 商 一 起 解决 。 而 且 一 个 漏洞 
有 时 很 难说 是 哪个 厂商 造成 的 ， 各 个 厂商 之 间 会 扯皮 。 第 二 个 问题 是 
当 一 个 软件 需要 更 新 时 ， 要 和 所 有 其 他 软件 共同 重新 测试 一 过 ， 这 样 
成 本 很 高 ， 使 随时 更 新 软件 变 得 几乎 不 可 行 。 而 汽车 软件 能 随时 下 载 
更 新 在 未 来 对 自动 驾驶 至 关 重 要 ， 因 为 今后 5 10 年 自动 驾驶 软件 随 着 
技术 进步 将 持续 快速 更 新 。 传 统 汽车 从 设计 定型 到 第 一 辆 汽车 出 广 需 
要 三 年 左右 的 时 间 ， 在 此 期 间 所 有 的 零 部 件 都 不 允许 改变 设计 。 但 在 
电脑 手机 行业 几乎 不 可 想象 一 个 软件 三 年 不 被 更 新 ， 目 前 特 斯 拉 汽 车 
几乎 每 个 月 都 有 一 次 软件 自动 更 新 。 另 外 ， 当 模块 增加 时 ， 又 加 上 很 
多 原来 没有 的 模块 ， 例 如 自动 萄 驶 模块 等 ， 软 件 的 可 靠 性 会 降低 。 这 
件 事 将 会 成 为 传统 厂商 的 阿 咯 琉 斯 之 路 。 对 于 新 进入 者 ， 特 别 是 电动 
车 来 说 ， 几 乎 所 有 的 软件 都 可 以 从 头 写 起 。 像 图 5. 8 右边 这 样 的 软件 结 
构 清晰 简单 ， 易 于 检 错 纠 错 ， 还 可 以 随时 进行 更 新 。 

OEMs: 隔绝 的 软件 包 Tesla: 中 央 操 作 系统 
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图 5.8 汽 车 软件 结构 ( 左 图 是 传统 汽车 软件 集成 ， 右 图 是 电动 车 全 部 自己 开发 ) 


颠 履 供应 链 


任何 一 个 制造 业 产 业 ， 当 产量 大 到 某 一 个 数量 级 时 (例如 上 二 万 
人 台 ) ， 束 开始 分 层 。 原 因 是 只 专注 于 一 个 水 平 层面 的 厂商 比 垂 直 集 成 
的 厂商 效率 更 高 。 产 业 分 层 的 必要 条 件 有 两 个 : 产量 足够 大 和 技术 成 
熟 。 汽 车 行业 历经 上 百年 的 演化 ， 早 已 变 成 一 个 多 层次 的 供应 链 生 
态 。 所 谓 供 应 链 束 是 这 个 产业 会 形成 由 不 同 公司 组 成 的 复杂 分 工 合作 
和 价值 增加 体系 。2017 年 全 球 共 销售 7 800 万 辆 车 ， 按 每 辆 车 均 价 3. 3 
万 美元 计算 ， 汽 车 产业 全 球 产 值 超过 两 万 亿美 元 。 居 于 供应 链 顶 端 
(和 消费 者 最 近 的 一 端 ， 通 常 也 是 生态 系统 中 砍 价 能 力 最 强 的 一 端 ) 
的 是 整 车 厂商 。 整 车 厂商 设 计 、 组 装 和 营销 汽车 ， 但 是 一 辆 汽车 上 几 
乎 所 有 的 部 件 都 是 从 生态 系统 的 其 他 三 商 采 购 的 。 直 接 给 整 车 广 商 提 
供 完 整 子 系统 〈 例 如 发 动机 、 传 动 、 章 车 、 转 回 、 音 啊 等 ) 的 叫 作 
“一 级 系统 集成 两 ” (Tier-l system integrator ) ， 人 全球 有 上 百 家 
一 级 系统 集成 商 。 给 一 级 系统 集成 商 提供 零 部 件 的 叫 二 级 系统 集成 
商 。 甚 至 还 有 三 级 供应 商 等 ， 整 车 三 商 自己 几乎 不 制造 任何 部 件 。 除 
了 少数 几 款 豪华 车 以 外 ， 绝 大 部 分 乘 用 车 都 是 由 这 种 水 平分 层 的 供应 
链 生 产 的 。 


像 汽车 产业 这 种 传统 产业 的 供应 链 是 相对 稳定 和 静态 的 。 所 谓 稳 
定 是 指 汽车 行业 在 供应 链 各 层次 都 有 许多 成 熟 的 大 型 供应 丙 并 且 多 年 
不 变 。 所 谓 静 态 是 指 一 辆 汽车 的 子 系统 和 零 部 件 由 哪些 三 丙 提供 在 汽 
车 定型 时 就 确定 下 来 了 ， 在 这 辆 车 的 寿命 期 内 不 会 改变 。 但 目 动 驾驶 
将 会 打破 这 个 稳定 的 供应 链 ， 一 个 可 移动 的 、 联 网 的 上 自动 要 驶 汽车 将 
成 为 继 电 脑 和 手机 之 后 的 下 一 个 超级 规模 信息 和 数据 平台 ， 原 来 的 静 
态 供应 链 将 变 为 动态 的 生态 系统 。 除 了 供应 链 中 的 子 系统 和 零 部 件 生 
产 三 商 以 外 ， 用 户 和 一 系列 内 容 服务 提供 商 也 将 参与 到 这 个 生态 系统 
中 来 一 起 为 生态 系统 增值 。 传 统 汽车 供应 链 是 一 个 封闭 系统 ， 新 汽车 
的 生态 系统 是 一 个 开放 系统 。 传 统 供应 链 是 稳定 和 静态 的 ， 新 生态 系 


统 将 是 变化 和 动态 的 ， 特 别 是 内 容 和 服务 。 玩 转 这 个 动态 的 生态 系 
统 ， 又 是 许多 新 进入 者 的 强项 。 


合 纵 连 横 


在 传统 汽车 产业 链 中 ， 人 整 车 广 商 坚 无 疑问 居于 龙头 地 位 ， 有 具有 最 
强 的 砍 价 能 力 ， 但 是 在 自动 驾驶 生态 系统 中 ， 谁 将 是 产业 链 龙头 还 有 
符 观 察 。 如 果 汽 车 妨 变 为 电脑 和 手机 ， 那 么 掌握 核心 必 片 和 操作 系统 
的 厂商 可 能 变 为 龙头 。 如 果 汽 车 巡 变 为 像 互 联网 一 样 的 信息 数据 平 
台 ， 那 么 掌握 用 户 的 内 容 服务 提供 丙 可 能 变 为 龙 状 。 有 一 点 很 清楚 ， 
不 论 谁 想 成 为 产业 链 龙 头 ， 都 要 掌控 目 动 驾驶 软件 。 目 前 围 纸 着 目 动 
轰 驶 软件 在 美国 市 场 已 经 形成 了 数 个 竞争 集团 。 


第 一 个 集团 是 围绕 在 图 形 蕊 片 广 商 英 伟 达 周围 的 供应 商 集 团 。 这 
个 集团 包括 整 车 厂商 丰 田 、 奥 迪 、 福 特 ， 一 级 供应 商 中 的 老大 博世 
(Bosch) ， 自 动 驾 驶 软件 平台 提供 商 百度 等 。 这 个 集团 侧重 的 是 提供 
需要 更 强大 计算 功能 的 L3 和 L4 自 动 驾驶 解决 方案 。 


第 二 个 集团 是 以 英特尔 2016 年 收购 的 以 色 列 公司 Mobileye 为 首 的 
供应 商 集团 ， 这 个 集团 包括 Mobileye 的 东家 英特尔 、 整 车 厂商 宝马 、 
一 级 供应 丙 前 十 大 厂商 之 一 的 德尔 福 (Delphi ) 等 。 这 个 集团 提供 
L2 L4 的 解决 方案 。 

第 三 个 集团 是 以 高 通 公 司 曾 经 想 收 购 的 NXP 公 司 为 首 的 供应 商 集 
团 。 这 个 集团 包括 整 车 厂商 奥迪 (也 同时 和 英 伟 达 集 团 合作 ) ， 一 级 
供应 商 中 前 九 大 厂商 之 一 的 采 埃 孚 (ZF) 。 

在 这 三 个 集团 中 ， 英 伟 达 集团 的 AI 芯片 能 力 最 强 ， 但 Mobileye 集 
团 几乎 垄断 了 L2 半 自动 驾驶 市 场 。 未 来 的 争斗 将 主要 在 这 两 个 集团 之 
间 进 行 。 


这 种 结盟 说 明了 两 个 问题 : 一 是 新 技术 新 产品 在 成 熟 的 过 程 中 需 
要 产业 链 各 单元 更 紧密 的 合作 甚至 垂直 集成 ;二 是 说 明 自动 驾驶 解决 
方案 非常 复杂 ， 没 有 一 家 公司 可 以 单独 提供 。 在 这 种 三 足 易 立 的 情形 
下 ， 传 感 右 供应 商 例如 激光 雷达 可 能 被 迫 选 边 站 队 ， 加 入 一 家 集团 。 
因为 英 伟 达 和 Mobileye 本 号 就 在 自己 的 芯片 上 提供 自动 区 驶 软件 解雇 
方案 ， 大 部 分 独立 的 上 自动 区 驶 软件 解决 方案 新 创 公 司 只 能 寄 希 望 于 目 
己 的 软件 解决 方案 比 三 大 集团 的 方案 更 优秀 ， 节 终 被 三 大 集团 之 一 ， 
或 者 被 休整 车 厂商 收购 。 


除了 以 上 三 个 提供 解决 方案 的 集团 之 外 ， 谷 歌 也 是 最 重要 的 自动 
罗 驶 解决 方案 提供 商 。 谷 歌 从 2009 年 开始 就 研究 自动 要 驶 ， 试 验 车 在 
谷歌 总 部 加 利 福 尼 亚 州 山 景 城 已 经 行驶 超过 了 483 万 千 米 。 谷 歌 的 目标 
从 第 一 天 开始 就 是 提供 L5 的 全 目 动 驾驶 方 采 。 它 不 仅 古 市 场 上 第 一 个 
研究 目 动 驾 驶 的 ， 而 且 是 今天 被 公认 为 最 成 熟 可 靠 的 自动 驾驶 解决 方 
案 提供 商 。 但 谷歌 似乎 并 没有 全 力 以 赴 把 它 的 解决 方案 卖 给 整 车 广 
商 ， 而 是 直接 和 分 享 出 行 公司 Lyft 〈 来 福 车 ) 进行 战略 合作 。 

当 一 个 产业 产量 小 或 者 技术 更 新 很 快 时 ， 垂 直 集 成 往往 是 更 好 的 
选择 ， 即 由 一 家 公司 直接 购买 所 有 的 零 部 件 ， 甚 至 自己 生产 部 分 零 间 
件 。 电 动 汽 车 的 量 一 定 会 很 大 ， 但 技术 还 在 快速 发 展 ， 特 斯 拉 与 当年 
苹果 公司 做 电脑 和 手机 一 样 ， 选 择 了 垂直 集成 。 它 不 仅 用 自己 的 半 自 
动 朗 驶 方案 取代 了 Mobileye 的 方案 ， 甚 至 目 己 研 肥 心 片 和 传感器 。 垂 
直 集 成 的 优势 是 完全 掌控 产品 的 性 能 和 用 户 体验 ， 人 劣势 是 要 投入 大 量 
的 研发 成 本 。 忌 体 来 讲 垂 直 集 成 产品 更 好 ， 但 比 水 平分 层 价 格 更 高 。 
所 以 许多 没有 那么 财 大 气 粗 的 电动 汽车 的 新 进入 者 仍然 选择 供应 链 模 
式 。 到 底 误 优 执 劣 很 难 次 ， 当 年 华 采 电脑 选择 垂直 集成 后 ， 败 给 了 更 
便宜 的 个 人 电脑 《后 来 改 用 英特尔 必 片 再 加 上 设计 的 改进 才 又 夺回 一 
部 分 市 场 份额 ,但 已 经 不 是 市 场 第 一 了 ) 。 蔷 果 手 机 到 今天 还 是 垂直 
集成 ， 虽 然 市 场 份额 一 直 在 受 安 转手 机 的 看 食 ， 但 仍然 是 市 场 第 一 。 
几乎 可 以 断定 在 今后 5 10 年 电动 车 的 产品 性 能 和 用 户 体验 一 定 是 特 斯 
拉 这 样 的 垂直 集成 厂商 更 好 ， 水 平分 层 厂 商 只 能 徘 价 格 优势 。 目 前 除 


了 特 斯 拉 以 外 卖 得 最 好 的 两 蒜 电动 汽车 分 别 是 通用 汽车 的 Bolt 和 日 产 
的 Leaf。 前 者 在 美国 的 售 价 和 特 斯 拉 3 型 车 的 售 价 相同 ， 约 为 3. 5 万 美 
元 ， 两 者 巡航 距离 都 是 320 干 米 左 右 。 日 产 Leaf 在 美国 售 价 为 3 万 美 
元 ， 但 巡航 距离 只 有 240 干 米 。 这 两 球 车 都 没有 半自动 驾驶 功能 ， 从 设 
计 和 功能 上 对 用 户 来 说 不 够 新 潮 。 


共 圣 次 补 出 行 


20 世 纪 初 汽车 刚 被 发 明 时 ， 绝 大 部 分 人 能 想到 汽车 因为 比 马 车 更 
快 所 以 未 来 会 取代 马车 。 但 很 少 有 人 能 想到 未 来 汽车 还 能 带 来 哪些 其 
他 变化 。 人 们 无 法 想象 由 于 汽车 的 速度 ， 人 们 可 以 搬 到 郊区 居住 。 由 
于 郊区 地 方 大 ， 人 们 的 住宅 会 由 城 里 的 高 层 公寓 变 为 独家 独院 的 小 
楼 。 由 于 人 们 居住 的 分 散 化 ， 郊 区 开始 出 现 有 大 停车 场 的 购物 中 心 。 
由 于 居住 在 郊区 ， 所 以 进一步 增强 了 对 汽车 的 需求 ， 由 于 汽车 保有 量 
的 急剧 增加 ， 大 量 多 车 道 的 快速 道路 和 高 速 公路 开始 修建 。 由 于 出 行 
的 方便 ， 旅 游 和 度假 成 为 普通 大 众 的 生活 娱乐 方式 。100 年 来 汽车 的 出 
现 彻 原 改变 了 都 市 和 乡村 的 地 貌 ， 改 变 了 人 类 的 基本 生活 方式 ， 改 变 
了 社会 组 织 。 


同样 ， 上 自动 区 驶 也 绝 非 仅仅 取代 人 来 驾驶 汽车 ， 我 们 今天 能 够 看 
到 的 只 是 未 来 可 能 性 的 一 部 分 。 对 汽车 产业 冲击 最 大 的 也 不 是 技术 变 
化 剖 来 的 新 进入 者 ， 而 是 技术 变化 带 来 的 产业 形态 的 变化 ， 其 中 最 大 
的 变化 之 一 就 是 自动 驾驶 将 使 目 己 买 车 并 且 独 享 变 得 极为 不 经 济 ， 共 
译 出 行将 成 为 最 经 济 的 选择 。 目 前 在 美国 每 英里 芍 驶 成 本 约 为 1 美元， 
每 年 供养 一 辆 汽车 的 成 本 约 为 10 000 美 元 (包括 车 辆 折旧 、 保 养 、 加 
油 、 各 种 牌照 、 保 险 等 ) 。 在 大 都 市 由 于 停车 不 便 和 道路 拥挤 ， 私 家 
车 的 成 本 更 高 ， 但 一 辆 私家 车 的 利用 率 只 有 5%。 目 前 即使 还 是 人 工 轰 
驶 ， 共 至 出 行 的 成 本 也 已 经 接近 或 低 于 私家 车 。 有 数据 表明 ， 每 一 辆 
共享 汽车 的 使 用 将 会 至 少 减少 5 辆 私家 车 。 所 以 在 旧金山 等 美国 大 城 


市 ， 年 轻 人 买 车 的 比例 开始 明显 下 降 。 目 前 共享 出 行 汽车 成 本 中 70% 
是 人 工 。 一 旦 实现 大 规模 自动 驾驶 ， 共 享 出 行 成 本 将 降低 到 目前 的 
30%。 有 研究 表明 ， 自 动 驾 驶 的 共享 出 行 成 本 将 是 私家 车 的 10%， 到 
2030 年 私家 车 将 降低 到 今天 的 20%， 美 国 汽车 总 保有 量 将 从 2. 5 亿 辆 降 
至 5 000 万 辆 ， 石 油 的 总 需求 量 将 从 每 天 1 亿 桶 降 人 至 7 000 万 桶 ， 这 一 切 
将 为 美国 家 庭 每 年 节约 1 万 亿美 元 。 未 来 个 人 仍然 可 能 会 买 车 ， 但 不 会 
独占 这 辆 车 ， 未 来 拥有 车 辆 的 方式 可 能 有 两 种 : 第 一 种 是 自己 优先 使 
用 ， 当 自己 不 用 时 放出 去 为 别人 服务 ;第 二 种 是 自己 买 车 作为 投资 加 
入 一 个 共享 出 行 的 组 织 。 


目前 在 美国 用 手机 打车 的 平均 等 待 时 间 是 3 分 钟 ， 在 中 国 由 于 交通 
拥挤 ， 平 均等 待 时 间 更 长 ， 特 别 是 上 下 班 高 蜂 。 当 共享 出 行 成 为 出 生 
的 主要 方式 时 ， 由 于 参与 的 车 辆 增加 ， 所 以 平均 等 待 时 间 会 进一步 降 
低 。 自动 各 了 第 来 的 另 一 个 变化 是 大 部 市 的 道路 拥挤 将 一 去 不 复 过， 
目前 许多 美国 城市 已 经 开始 停止 道路 扩建 规划 ， 停 止 修建 新 的 停车 
场 ， 甚 至 开始 考虑 将 已 有 的 停车 场 改 为 微型 城市 绿地 。 未 来 城市 交通 
规划 也 将 深 受 共 享 出 行 影响 ， 城 市 交通 将 形成 以 高 速 轨道 交通 和 自动 
各 驶 及 自行 车 为 主 的 公共 交通 系统 。 高 速 轨道 系统 负责 远 距离 主干 线 
运输 ， 自 动 驾 驶 和 自行 车 负责 支线 和 最 后 一 千 米 。 当 上 下 班 更 依赖 轨 
We 
间 行 驶 速度 是 每 小 时 30™50 千 米 ， 这 个 速度 完全 可 以 再 提高 一 两 倍 。 
北京 这 样 的 超大 起 市 为 例 ， 如 打从 五 环 外 到 国贸 上 滥 ， 自 动 加 以 
根据 地 铁 时 刻 表 精确 地 在 地 铁 站 接送 ， 使 整个 通勤 时 间 缩减 至 少 一 
自动 驾驶 将 为 房屋 建筑 带 来 变化 ， 例 如 大 量 的 独院 房屋 不 再 需 
车 库 ， 大 量 高 层 公 宽 不 再 需要 这 么 多 停车 位 等。 自动 罗 台 还 会 给 社区 
带 来 新 的 变化 ， 例 如 上 下 班 方向 相同 的 邻居 将 会 每 天 有 见面 或 接触 的 
机 会 。 


汽车 内 部 的 设计 将 被 自动 匠 驶 根本 性 地 改变 ， 例 如 多 人 共享 的 一 
辆 上 自动 概 驶 汽车 内 部 可 能 会 分 为 几 个 私密 的 空间 ， 大 屏幕 地 图 显示 和 
视听 娱乐 设备 将 成 为 标准 配置 ， 车 中 将 有 上 自动 饮料 售 货 机 等 。 车 型 也 
会 发 生 巨 大 分 化 ， 根 据 不 同 的 需求 ， 可 能 出 现 可 以 睡觉 的 车 、 可 以 打 
牌 的 车 、 可 以 唱 卡 拉 人 所 的 车 ， 等 等 。 


未 来 自动 驾驶 汽车 大 部 分 将 是 电动 车 ， 电 动车 还 会 给 汽车 基础 设 
施 带 来 巨大 变化 。 第 一 个 变化 是 当 汽 油 车 减少 时 ， 加 油 站 也 会 减少 ， 
加 油 变 得 不 方便 也 将 会 进一步 减少 汽油 车 ， 如 此 循环 下 去 ， 汽油 车 可 
能 会 和 今天 的 柴油 车 一 样 稀少 。 第 二 个 变化 是 维修 体系 。 由 于 个 人 不 
再 拥有 汽车 ， 所 以 汽车 的 管理 和 维修 将 主要 由 出 行 公司 负责 ， 车 辆 的 
检修 和 维护 将 更 程序 化 与 集中 化 ， 个 体 的 修 车 店 将 消失 。 

自动 驾驶 将 改变 汽车 保险 业 。 目 前 的 汽车 交通 事故 中 90% 以 上 是 人 
的 原因 。 当 道路 上 大 部 分 是 自动 轨 驶 车 辆 时 ， 交 通 事故 率 将 大 大 下 
降 。 研 究 表明 ， 美 国 车 险 市 场 到 2040 年 将 从 现在 的 年 度 2 000 亿 美元 下 
降 为 800 亿 美元 ， 下 降 60%。 


以 上 的 变化 都 是 今天 可 以 预见 到 的 ， 还 有 许多 变化 是 更 间接 隐 敞 
的 ， 今 天 不 容易 预见 。 例 如 今天 共 至 出 行 主要 由 儿 家 全 球 性 的 移动 互 
联网 平台 公司 提供 ， 服 务 主要 是 车 辆 的 安全 保障 、 罗 驶 员 管 理 、 目 动 
路 线 规划 等 。 当 车 辆 上 自动 驾驶 后 ， 这 些 流程 的 成 本 会 越 来 越 低 。 再 加 
上 共有 至 出 行 的 本 地 化 特点 以 及 和 其 他 公共 交通 的 紧密 关联 ， 未 来 共享 
出 行 很 可 能 会 整合 为 本 地 公共 交通 出 行 服务 中 的 一 部 分 ， 由 本 地 机 构 
以 极 低 的 成 本 提供 ， 而 不 是 由 几 家 全 球 或 全 国 性 公司 统一 提供 。 


运输 和 物流 


目 动 驾 驶 带 来 的 力 一 个 巨大 变化 将 体现 在 运输 和 物流 行业 。 目 前 
美国 和 中 国都 有 一 批 新 创 公 司 在 研究 卡 车 目 动 轨 驶 、 港 口 装卸 、 仓 储 
目 动 拣选 分 配 和 上 自动 快递 。 相 对 于 乘 用 车 ， 货 物 运 输 卡 车 大 量 时 间 征 


在 高 速 公 路 上 轰 驶 ， 要 处 理 的 状况 相对 人 简单。 目前 在 美国 人 工 成 本 所 
卡车 运输 的 40%， 汽 油 占 25%， 目 动 驾 驶 和 电动 车 将 使 卡车 运输 的 成 本 
降低 至 少 一 半 。 港 口 、 堆 场 、 人 矿山、 农场、 建筑 工地 、 仓 库 等 相对 封 
财 的 场合 比 城市 区 驶 的 情形 更 为 简单 。 即 使 在 技术 早期 ， 也 不 会 有 过 
多 人 号 生 命 安 全 风险 ， 在 这 些 领 域 将 会 率先 实现 目 动 要 驶 。 在 每 一 个 
目 动 要 驶 的 垂直 市 场 都 可 以 造 束 一 个 市 值 超过 10 亿 美元 的 “ 独 角 组 ” 
企业 。 今 天 中 国 的 各 种 物品 的 快递 主要 依赖 于 廉价 到 动力 ， 随 着 荔 动 
力 成 本 的 提高 ，“ 最 后 一 公里 ”快递 自动 化 (和 目 动 驾 驶 汽车 和 无 人 
机 ) 也 将 早 于 乘 用 车 目 动 驾驶 的 全 面 普及 。 


中 国 的 机 会 


即使 自动 驾驶 局 限 在 狭义 的 造 车 产业 ， 也 将 会 创造 全 球 每 年 2 万 亿 
美元 的 机 会 。 如 果 加 上 对 其 他 行业 的 影响 ， 目 动 驾 驶 产生 的 商业 机 会 
可 能 在 十 年 后 达到 每 年 十 万 亿美 元 的 数量 级 。 上 自动 驾驶 将 是 中 国 今后 
10 20 年 面临 的 最 大 的 一 个 全 球 性 产业 机 会 。 


1. 庞大 的 制造 业 能 力 和 全 球 第 一 的 电子 制造 生态 


人 NN 


未 来 的 自动 要 驶 电动 汽车 主要 是 一 个 电子 产品 ， 而 中 国 的 电子 制 
造 业 规 模 和 水 平 都 已 经 是 世界 一 流 《〈 核 心 芯 片 除 外 ) 。 中 国 的 汽车 产 
量 在 2016 年 已 经 达到 2 800 万 辆 ， 成 为 世界 第 一 。 中 国 的 汽车 产业 的 短 
板 在 于 发 动机 和 自动 变速 箱 等 ， 但 电动 汽车 恰恰 同时 跨越 了 这 几 个 短 
板 。 自 动 罗 驶 的 核心 硬件 主要 是 各 类 传感器 ， 例 如 GPS、 声 呐 、 紧 米 波 
雷达 和 激光 雷达 ， 这 些 电 子 零 部 件 都 能 够 在 中 国生 产 。 所 以 强大 的 电 
子 制 造 能 力 将 成 为 中 国 最 大 的 优势 。 


2. 具有 前 瞻 性 的 新 能 源 和 环保 政策 


中 国 目 前 是 全 世界 空气 污染 最 严重 的 国家 之 一 ， 同 时 也 是 碳 排放 
量 最 大 的 国家 。 中 国政 府 为 了 迅速 改善 空气 质量 和 大 幅 降 低 矶 排放 
量 ， 制 定 了 全 世界 最 具有 力度 的 或 励 发 展 新 能 源 的 政策 。 与 此 同时 ， 
2017 年 上 台 的 美国 总 统 唐纳德 。 特 明 普 在 新 能 源 政策 上 大 幅度 倒退 ， 
这 给 中 国 提 供 了 一 个 成 为 全 世界 新 能 源 技术 领导 者 的 机 会 。 


3. 发 达 的 交通 基础 设施 和 现代 物流 


中 国 四 通 八 达 的 高 速 公 路 以 及 发 达 的 物流 ， 为 目 动 驾 驶 技术 提供 
了 世界 最 大 的 垂直 市 场 。 


4. 电动 车 发 展 速度 快 
中 国 目 前 对 电动 车 的 政策 补贴 力度 是 全 世界 最 大 的 。2017 年 中 
共 销 售 60 万 辆 电动 车 ， 比 2016 年 增加 71%， 占 全 世界 总 量 的 一 半 。 随 着 


规模 的 增加 ， 中 国生 产 的 电动 车 〈 包 括 动 力 电池 ) 成 本 会 更 低 ， 中 国 
的 电动 车 将 上 共有 大 规模 出 口 的 潜力 。 


5. 世界 第 一 大 共 圣 出 行 市 场 
中 国 目前 也 是 世界 第 一 大 共享 出 行 市 场 。 截 至 2018 年 3 月 ， 滴 滴 出 


行 每 天 提供 2 500 万 次 服务 ， 美 国 的 Uber 〈 优 步 ) 在 其 提供 服务 的 78 个 
国家 每 天 共 提 供 约 1 000 万 次 服务 。 


6. 移动 支付 世界 普及 率 最 高 


中 国 的 手机 文 付 量 世 界 第 一 ， 为 共享 出 行 和 未 来 一 系列 复杂 的 商 
业 模 式 提 供 了 基础 。 


7. 复杂 多 元 的 驾驶 场景 


目 动 驾驶 软件 是 一 个 “大 杂烩 ”， 主 要 绯 大 量 的 数据 学 习 和 软件 
友 代 ， 中 国 提供 了 大 量 的 数据 和 复杂 的 场景 ， 在 中 国 场景 学 习 出 来 的 
驾驶 软件 在 其 他 地 方 适 应 性 会 很 强 。 


8. 对 中 国 上 自动 驾驶 产业 政策 的 建议 
(1) 继续 梯度 式 补贴 电动 车 ， 直 到 在 不 补贴 情形 下 电动 车 的 购买 
+ 保有 成 本 低 于 同 档次 的 汽油 车 。 


(2) 顺应 技术 对 产业 的 题 获 ， 打 破 地 方 政府 资本 造成 的 分 散 格 
局 ， 或 励 产 业 重 组 。 


(3) 上 自动 驾驶 在 成 熟 的 过 程 中 难免 会 出 事故 ， 不 能 因 吧 废 食 。 
(4) 技术 创新 主要 依靠 市 场 和 企业 ， 特 别 是 高 科技 创新 企业 。 
(5) 创新 先行 ， 监 管 押 后 。 


关于 目 动 驾驶 的 六 种 预测 


预测 未 来 永远 有 风险 ， 但 可 以 促使 自己 深入 思考 ， 也 能 引起 有 质 
量 的 讨论 。 


1，2022 年 以 后 半自动 驾驶 功能 将 成 为 所 有 15 万 
元 人 民 币 以 上 车 型 的 标 配 


半自动 驾驶 包括 2016 年 特 斯 拉 率 先 推出 的 自 适 应 巡航 (自动 和 前 
车 保持 距离 )、 自 动 紧急 刹车 、 自 动 线 道 保 持 、 自 动 换 道 、 自 动 泊 车 
等 基本 功能 。 目 前 ， 这 些 功能 所 需 的 硬件 成 本 〈 摄 像 头 、 毫 米 波 雷 
达 、 处 理 忌 片 等 ) 不 超过 5 000 元 人 民 币 。2016 年 中 国生 产 了 2 800 万 
辆 汽车 ， 跃 居 世 界 第 一 ， 每 辆 车 均 价 13 万 元 人 民 币 。 假 设 汽车 均 价 每 
年 增长 3%，2022 年 汽车 均 价 会 达到 15 万 元 人 民 币 ， 届 时 所 有 均 价 以 上 
车 型 都 将 配备 半自动 驾驶 功能 。 


2. 分 步 演进 成 为 主流 


目前 许多 厂家 宣称 2021 一 2022 年 会 推出 L5 全 自动 驾驶 汽车 ， 这 个 
目标 很 难 实现 ， 乘 用 车 不 会 一 次 到 位 L5， 甚 至 不 会 一 步 到 位 L4。 下 一 
步 是 在 半自动 基础 上 再 加 上 交通 标志 识别 和 本 地 高 精度 地 图 ， 这 样 就 
能 够 做 到 在 都 市 地 区 把 每 天 上 下 班 通勤 自动 化 ， 这 就 能 够 带 来 90% 的 
便利 ， 其 他 10% 的 长 尾 情况 可 以 逐步 解决 。2021 一 2022 年 有 望 实 现 这 
样 的 便利 。 


3. 非 限定 场景 乘 用 车 全 自动 驾驶 到 来 的 时 间 比 想 
象 得 晚 


最 后 的 10% 将 要 耗费 比 前 面 90% 多 得 多 的 时 间 。 由 于 在 非 限 定 区 域 
轰 驶 的 复杂 性 以 及 履 盖 大 范围 的 高 精度 地 网 尚 需 时 日 ， 所 以 真正 的 非 
限定 区 域 的 无 方向 盘 全 自动 驾驶 至 少 需要 十 年 以 上 的 时 间 ， 也 许 会 进 
入 一 个 瓶颈 期 ， 很 长 时 间 也 解决 不 了 。 


4. 垂直 市 场 将 早 于 乘 用 车 市 场 


率先 成 熟 的 市 场 是 那些 驾驶 环境 相对 简单 的 行业 应 用 ， 如 海港 、 
货场 、 和 矿山、 农业、 基建、 仓储 、 货 物 运 输 、 旅 游 景区 等 。 


5. 新 进入 者 将 逐步 占领 市 场 


从 电子 制造 业 和 互联 网 行业 进入 汽车 行业 的 新 进入 者 ， 在 十 年 内 
将 “号 掉 ” 一 半 以 上 的 汽车 市 场 。 未 来 产业 融合 更 多 的 是 新 科技 巨头 
收购 传统 汽车 公司 。 


6. 中 国 制 造 将 成 为 世界 领袖 


中 国电 动车 制造 规模 将 成 为 世界 领袖 ， 同 时 将 制造 全 球 80% 以 上 的 
传感器 ， 包 括 坚 米 波 雷达 和 激光 雷达 。 在 技术 上 除了 核心 处 理 忆 片 以 
外 全 面 领 和 气 ， 特 别 是 需要 复杂 场景 训练 欠 代 的 目 动 轨 驶 软件 。 


以 上 对 未 来 做 出 的 几 个 明确 而 不 含糊 的 预测 ， 等 待 未 来 验证 。 


医疗 与 健康 一 一 世界 上 最 有 经 验 的 医生 


医疗 健康 是 AI 最 热门 的 应 用 领域 之 一 ， 医 疗 行业 有 太 多 的 方面 可 
以 借助 AI 得 到 质 的 提升 。 据 追踪 风 投 动态 的 数据 公司 CB Insights 的 数 
据 显 示 ， 从 2012 年 至 2017 年 7 月， 医疗 行业 有 270 笔 投 融 资 交易 。 语 音 
识别 、 图 像 识别 技 术 、 深 度 学 习 技 术 已 经 和 医疗 行业 快速 融合 ， 在 辅 
助 诊疗 、 医 学 影像 、 药 品 研发 、 数 字 健 康 、 疾 病 预测 、 虚 拟 护士 等 领 
域 应 用 ， 提 升 药品 的 研发 速度 、 医 生 的 诊断 医治 效率 、 患 者 的 健康 管 
理 等 。 医 疗 数 据 目前 较为 分 散 ， 这 给 不 少 创业 公司 提供 了 从 垂直 领域 
切入 的 机 遇 。 


医学 影像 


AI 在 医疗 健康 领域 的 第 一 个 重要 的 应 用 是 医学 影像 诊断 。2016 年 
11 月 ， 美 国 FDA (食品 药品 监督 管理 局 ) 颁发 了 第 一 个 医疗 AI 软件 平台 
的 许可 。 这 个 软件 平台 是 斯 坦 福 大 学 校友 创办 的 Arterys 心 脏 核磁 共振 
成 像 诊 断 平 台 。 这 个 平台 用 1 000 个 已 知 图 像 对 模型 进行 了 训练 。 心 脏 
可 以 分 为 17 个 部 分 ， 通 过 这 些 部 分 的 影像 可 以 判断 心脏 是 否 有 问题 。 
要 通过 FDA 批 准 ， 这 个 平台 的 判断 至 少 要 和 专业 医生 一 样 准确 ， 这 个 平 
台 可 以 在 15 秒 内 做 出 判断 ， 而 有 经 验 的 医生 通常 需要 半 小 时 到 一 小 
时 ， 比 医生 快 了 200 倍 左右 。 


我 们 知道 癌症 早期 发 现 的 治愈 率 远 远 高 于 中 上 晚期。 如果 发 现 得 
早 ， 那 么 五 年 存活 率 可 以 达到 97%， 但 如 果 在 最 晚期 发 现 ， 那 么 五 年 存 
活 率 只 有 14%。 如 何 让 那些 不 方便 看 皮肤 科 医 生 的 人 能 够 最 早 发 现 病情 
就 成 为 关键 。 美 国 每 年 有 540 万 例 皮 肤 辣 ，2017 年 初 ， 斯 坦 福 大 学 AI 实 
验 室 的 Thrun 〈 特 伦 ) 教授 的 博士 生 开发 出 了 一 个 可 以 诊断 皮肤 癌 的 AI 
算法 。 他 们 用 已 经 认证 过 的 370 张 含有 恶性 皮肤 癌 和 恶性 黑色 素 瘤 的 图 
片 让 算法 和 21 位 皮肤 科 医 生 的 判断 相 比 较 ， 算 法 在 各 方面 都 达到 了 和 
医生 相同 的 判断 准确 度 。 


中 国 是 全 球 肺 癌 死 亡 率 和 发 病 率 最 高 的 国家 。 据 测算 仪 2015 年 中 
国 就 有 429. 2 万 新 发 肿瘤 病例 和 281. 4 万 死亡 病例 ， 肺 癌 是 发 病 率 最 高 
的 肿瘤 ， 也 是 癌症 死因 之 首 。2015 年 中 国 新 发 47. 7 万 例 食 管 癌 ， 占 全 
球 的 50%。 新 增 肺癌 病例 73. 33 万 ， 占 全 球 的 35. 8%， 中 晚期 占 70%。 目 
前 最 有 效 的 手段 就 是 科 查 ， 早 期 诊断 和 早期 治疗 能 将 患者 的 五 年 生存 
率 提 高 到 80% 以 上 。 


表 5.1 中 国 、 美 国 、 英 国 的 癌症 发 病 率 与 死亡 率 


75 岁 前 患 癌 症 的 风险 


75 岁 前 因 瘤 症 死亡 的 风险 


癌症 死亡 率 /发 病 比率 


资料 来 源 : IARCG《 五 大 洲 癌 症 发 病 举 》。 

肺癌 早 得 的 难点 主要 是 : 早期 肺 冶 多 表现 为 肺 部 结 节 。 它 们 尺寸 
小 ， 对 比 度 低 ， 非 常 容易 跟 其 他 的 组 织 部 位 混淆 ， 患 者 的 CT 扫描 数量 
通常 超过 200 层 ， 人 工 阅 片 耗 时 耗 力 。 腾 讯 公司 推出 的 “腾讯 疯 影 ” 技 
术 ， 利 用 多 尺度 三 维 卷 积 神经 网 络 实现 肺 部 图 像 的 三 维 分 割 与 重建 ， 
结合 金 标准 〈 指 当前 临床 医学 界 公 认 的 诊断 疾病 的 最 可 靠 、 最 准确 、 
最 好 的 诊断 方法 ) 病理 诊断 数据 和 大 量 医 生 标注 的 结 节 位 置信 息 ， 
3 ~10 毫 米 肺 结 节 检 测 准 确 率 达 到 95%， 肺 癌 识 别 率 已 经 达到 80%， 并 且 
还 能 通过 增强 图 像 与 放大 片子 辅助 医生 查看 。 目 前 ， 该 技术 已 经 与 数 
家 三 甲 医院 进行 合作 。 该 类 技术 的 逐步 商用 有 望 大 幅 降 低 癣 症 患 者 的 
发 现 率 和 死亡 率 。 

肺 部 CT 图 像 模板 提取 高 证 分 类 


y 
图 像 插值 


输入 图 像 


图 5.9 人 工 智能 在 早期 肺癌 筛 查 中 的 应 用 
图 片 来 源 : 腾讯 克 影 。 
表 5.2 50 例 早期 肺癌 筛 查 人 机 对 比 实验 结果 


人 机 对 比 实验 早期 肺癌 〈 敏感 度 ) 良性 样本 ( 特异 度 ) 


腾讯 殉 影 96% 88% 


20 名 三 甲 医院 
主治 医生 以 上 
(包括 数 名 主任 医生 ) 平均 


资料 来 源 : https://miying. qq. com/official/product/1ung。 


医疗 图 像 识别 比 人 脸 图 像 识别 要 困难 。 例 如 早期 肿瘤 的 诊断 ， 人 
体 组 织 是 否 有 病变 常常 表现 为 该 组 织 影 像 的 大 小 、 形 状 、 灰 度 上 细微 
的 差别 。 与 人 脸 图 像 识 别 相 比较 ， 医 疗 图 像 识 别 的 挑战 在 于 病变 组 织 
的 形状 和 样 态 变化 非常 大 。 这 些 变 化 由 下 列 因 素 造成 。 


(1) 成 像 噪 首 。 由 于 在 使 用 医疗 成 像 仪器 时 照 财 剂 量 和 显影 剂 浓 
度 不 同 ， 所 以 组 织 的 清晰 度 差别 很 大 。 


(2) 患者 个 体 差 别 。 患 者 的 喘 高 、 体 重 、 鼎 官 大 小 、 脂 肪 厚薄 都 
会 影响 成 像 。 


(3) 患者 在 成 像 过 程 中 的 姿势 、 动 作 和 器 官 活动 也 会 影响 成 像 。 
(4) 内 脏 上 器官 的 位 置 ， 例 如 右 官 之 间 的 接触 和 让 挡 会 影响 成 像 。 


(5) 医疗 判 断 的 准确 性 和 可 靠 性 要 求 。 与 大 部 分 人 脸 识别 不 同 ， 
医疗 图 像 的 判断 关乎 人 命 ， 不 可 出 错 。 


为 了 使 医疗 图 像 识 别 更 准确 ， 通 常 借助 下 列 两 个 办 法 。 


第 一 ， 大 数据 库 。 美 国 每 年 有 9 000 万 张 CT 片 子 ， 训 练 数据 集 越 
大 ， 各 种 情形 就 包含 得 越 多 。 

第 二 ， 解 剖 学 和 病理 学 背景 知识 。 所 有 的 医疗 图 像 都 来 自 人 体 的 
东 一 个 部 分 ， 解 剖 学 和 病理 学 的 知识 可 以 帮助 识别 和 判断 。 但 解剖 学 
和 病理 学 知识 通常 用 于 基于 规则 的 判断 或 者 是 基于 病理 模型 的 判断 。 
但 这 两 种 方法 无 法 融入 神经 网 络 模型 ， 所 以 只 能 和 神经 网 络 并 行使 
用 。 当 两 者 判断 一 致 时 可 以 增加 神经 网 络 判断 的 可 信和 度 ， 但 当 两 者 判 
断 不 一 臻 时， 该 相信 哪 一 个 的 判断 呢 ? 最 后 还 是 需要 有 经 验 的 医生 。 


目前 的 人 工 智能 医疗 影像 识别 判断 的 主要 作用 是 辅助 判断 ， 还 不 
能 不 经 过 医生 审核 签字 就 直接 做 判断 。 但 即使 是 辅助 判断 ， 也 可 以 提 
高 读 片 质量 或 加 快速 度 。 中 国 的 三 甲 医院 每 天 可 能 产生 上 千张 各 种 影 
像 ， 目 前 的 程序 是 先 由 初级 医生 读 片 ， 包 括 在 影像 上 寻找 异常 位 置 、 
测量 和 记录 ， 和 初步 判 断后 把 报告 交 给 资深 医生 审阅 再 做 最 后 判断 。 即 
使 医生 在 每 张 医疗 图 片上 只 花 10 分 钟 时 间 ， 一 名 医生 8 小 时 不 间断 读 片 
也 只 能 读 48 张 片子 ， 一 天 如 果 有 480 张 片子 ， 则 需要 10 位 医生 读 片 。 况 
且 在 一 些 国家 与 地 区 ， 为 了 保证 准确 度 ， 医 生 的 阅 片 数量 被 限定 在 一 
定 范围 内 。 在 三 甲 医院 ， 有 经 验 的 医疗 影像 〈 例 如 放射 科 ) 医生 远 远 
供不应求 。 如 果 人 工 智能 读 片 能 够 把 时 间 从 原来 的 10 分 钟 缩短 到 5 分 
钟 ， 束 可 以 多 读 一 倍 的 图 片 。 由 于 医疗 成 像 设 备 成 本 快速 下 降 ， 超 
声 、X 光 、CT、 核 磁 共 振 以 及 PET 〈 正 电子 发 射 计算 机 断层 显 像 ) 等 设 
备 正在 广泛 普及 ， 医 学 影像 数据 大 幅度 增长 。 美 国 的 数据 年 增长 率 达 
到 了 60%， 但 专业 图 像 医生 的 增长 率 只 有 2%。 中 国 的 医学 影像 增长 也 达 
到 了 30%， 而 医生 的 增长 只 有 4%。 这 意味 着 医生 的 工作 量 大 增 ， 判 断 准 
确 性 下 降 。 从 影像 方面 的 误诊 人 数 来 看 ， 美 国 的 误诊 人 数 达 到 了 1 200 
万 /年 ， 而 中 国 因为 人 口 基数 庞大 ， 达 到 了 惊人 的 5 700 万 /年 ， 这 些 误 
诊 主要 发 生 在 基层 医疗 机 构 。 


目前 中 国 优质 医疗 资源 高 度 集中 在 大 城市 。 许 多 县 级 以 下 医院 昌 
然 都 有 能 力 添 置 更 多 的 医疗 影像 设备 ， 但 严重 缺乏 有 经 验 的 读 片 医 


生 。 如 果 AI 医 疗 影像 诊断 能 达到 有 经 验 医 生 的 水 平 ， 那 么 通过 网 络 上 
传 读 片 将 大 大 提高 中 国 基 层 医 疗 机 构 对 疾病 的 诊断 水 平 。 可 以 预见 ， 
未 来 基于 云 服务 的 医疗 影像 识别 判断 将 在 基层 医院 的 影像 识别 和 判断 
上 发 挥 主要 作用 。 一 旦 这 样 的 实验 成 功 ， 将 适用 于 全 世界 所 有 的 发 展 
中 国家 ， 甚 至 很 多 发 达 国 家 。 

从 目前 来 看 ， 人 工 智 能 医疗 影像 的 技术 都 是 从 医院 体系 外 部 开始 
的 ， 主 要 由 高 科技 新 创 公 司 提供 技术 和 医院 合作 。 这 些 公 司 的 后 台 算 
法 模型 和 计算 能 力 部 大 同 小 寞 。 关 键 看 谁 能 从 医院 得 到 更 多 以 往 被 验 
证 过 的 独家 数据 ( 即 用 于 训练 神经 网 络 模型 的 “干净 ”的 已 标注 数 
据 》“。 这 些 公司 苋 争 的 第 二 个 能 力 束 是 业务 拓展 能 力 和 市 场 倘 略 例 
如 专攻 三 甲 医院 还 是 面向 基层 ) 。 在 这 个 领域 未 来 可 能 出 现 一 些 新 的 
商业 模式 ， 例 如 当 技 术 成 熟 时 设立 一 家 专门 的 医疗 影像 识别 判断 机 
构 ， 专 门 为 大 量 的 基层 医院 提供 外 包 服 务 。 这 样 的 趋势 也 将 影响 医学 
院 的 课程 设置 和 培养 学 生 的 方 问 。 


发 现 新 药 


AI 在 医疗 健康 领域 的 第 二 个 重要 应 用 是 制药 。 小 分 子 化 合 物 新 药 
发 现 的 简单 原理 是 找到 一 种 化 合 物 的 分 子 结构 能 够 和 要 “对 付 ” 的 生 
化 目标 《例如 瘤 症 细胞 中 的 某 种 和 蛋白质 或 被 病毒 攻击 的 人 体 正 常 重 白 
质 ) 及 生 反 应 ， 激 活 或 抑制 目标 香 白 质 的 东 些 功能 。 传 统 的 发 现 新 药 
的 方法 是 试 错 ， 像 爱迪生 发 明 铝 丝 灯 泡 一 样 试验 成 二 上 万 种 不 同 的 化 
合 物 。 但 是 这 种 试 错 法 成 本 极 高 ， 因 为 第 选 出 一 个 新 药 的 备 先 化合物 
要 做 大 量 的 实验 ， 还 要 逐一 比较 该 化 合 物 的 有 效 性 和 毒 副 作用 等 。 如 
图 5. 10 所 示 ， 世 界 大 药 三 研 及 一 天 新 药 的 费用 在 2010 年 已 经 达到 26 亿 
美元 ， 今 天 早已 大 大 超过 这 个 数额 。 其 中 临床 前 阶段 超过 10 亿 美元 ， 
这 10 亿 美元 主要 是 用 于 初期 的 筛选 和 试 错 。 从 大 量 的 化 合 物 中 乌 选 出 
备 选 化 合 物 直 到 最 后 优化 出 新 药 不 仅 耗 资 巨 大 ， 而 且 过 程 长 达 数 年 。 


( 百 万 美元 ) 
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图 5.10 不 同年 代 新 药 的 研发 成 本 


数据 来 源 : Tufts Center for the Study of Drug Development, CSDD。 

在 基于 深度 学 习 的 人 工 智 能 成 熟 之 前 ， 新 药 研发 已 经 广泛 使 用 计 
算 机 辅助 制药 。 根 据 人 类 已 有 的 生化 知识 ， 例 如 备 选 化 合 物 以 及 目标 
分 子 结构 和 特性 ， 计 算 机 可 以 通过 建立 模型 来 模拟 化 合 物 和 目标 香 白 
质 的 生化 反应 ， 从 而 减少 实验 和 缩短 时 间 。 传 统 的 计算 式 新 药 发 现 可 
以 说 是 建立 在 对 分 子 结构 理解 基础 上 的 “上 白 箱 操作 ”模式 。 而 基于 深 
度 学 习 的 新 药 发 现 则 是 一 种 “黑箱 操作 ”模式 。 在 “黑箱 操作 ”模式 
下 ， 计 算 机 并 不 需要 建立 化 合 物 的 分 子 结构 模型 ， 甚 至 不 需要 了 解 备 
选 化 合 物 及 生化 目标 的 特性 ， 而 只 需要 有 大 量 的 已 有 化 合 物 和 已 研究 
过 的 生化 目标 之 间 的 生化 反应 数据 。 用 这 些 已 有 数据 来 训练 神经 网 络 
模型 ， 训 练 好 的 深度 学 习 算 法 可 以 在 很 短 的 时 间 里 从 大 量 不 同化 合 物 
中 筛 选 出 可 能 有 用 的 备 选 化 合 物 。 这 里 被 科 选 的 大 量化 合 物 也 不 是 随 
机 产生 的 ， 完 全 可 以 根据 人 类 已 有 的 知识 用 计算 机 模型 产生 那些 可 能 


性 比较 大 的 化 合 物 。 同 样 的 原理 ， 在 备 选 化 合 物 进一步 被 般 选 时 ， 例 
如 进行 化 合 物 的 生物 可 利用 性 、 代 谢 半衰期 和 毒 副 作用 的 实验 时 ， 仍 
然 可 以 用 已 有 的 数据 进行 识别 和 筛选 。 这 个 原理 类 似 一 个 有 经 验 的 媒 
小 ， 当 媒 婆 拿 到 一 个 要 找 对 象 的 小 伙 子 的 资料 时 ， 媒 小 根 据 小 伙 子 的 
长 相 、 身 高 、 脾 气 、 职 业 、 收 入 等 在 自己 的 记忆 中 寻找 类 似 的 小 伙 子 
成 功 配对 的 案例 ， 束 能 八 九 不 离 十 地 给 他 介绍 一 个 有 和 希望 成 功 的 姑 
娘 。 目 前 硅谷 和 欧洲 已 经 有 几 家 用 深度 学 习 发 现 新 药 的 公司 ， 如 位 于 
旧金山 的 Atomwise。 


诊断 与 监测 


AI 在 医疗 健康 领域 的 第 三 个 重要 的 应 用 是 基于 医疗 大 数据 的 诊 
断 、 预 测 和 健康 监测 。 医 疗 诊断 的 挑战 在 于 : 第 一 ， 人 体 是 一 个 复杂 
的 系统 ， 第 二 ， 所 请“ 同一 种 疾病 ”其 实在 每 个 个 体 身 上 都 有 很 大 的 
不 同 ， 例 如 当 一 个 患者 血糖 高 时 ， 可 能 影响 到 心 、 肝 、 脾 、 肺 、 肾 、 
胰腺 等 多 个 堪 官 ， 不 同 的 患者 影响 不 同 。 即 使 是 很 有 经 验 的 医生 也 很 
难 考 虑 得 很 周全 ， 特 别 是 优质 医疗 资源 紧张 的 地 方 ， 例 如 中 国 的 北 
京 、 上 海 等 地 ， 门 诊 医生 能 花 在 每 个 患者 身上 的 诊断 时 间 只 有 几 分 
钟 ， 医 生 只 能 根据 经 验 和 患者 的 情况 做 一 个 大 致 的 疾病 分 类 判断 ， 而 
基于 人 工 智能 的 诊断 可 以 做 精细 化 的 诊断 。 第 一 步 是 收集 整理 患者 的 
数据 ， 包 括 各 类 化 验 和 检查 结果 、 患 者 主诉 和 医生 判断 。 将 这 些 数据 
整理 和 清洗 《剔除 明显 错误 或 无 天 数据 ) 后 ， 将 各 类 病症 的 相关 性 整 
理 出 来 。 图 5. 11 是 硅谷 AI 医 疗 诊断 公司 CloudMedx 关 于 各 种 疾病 症状 之 
间 的 相关 图 。 图 中 的 每 一 个 市 点 都 是 某 类 特定 患者 (特定 性 别 、 年 
龄 、 种 族 等 ) 的 某 种 症状 。 节 点 之 间 的 连 线 是 两 种 症状 之 间 的 相关 
性 ， 收 集 的 患者 数据 量 越 大 ， 节 点 就 越 多 ， 相 关 性 就 越 准 确 。 这 种 超 
级 相关 图 就 可 以 是 深度 学 习 里 面 的 用 于 训练 机 器 模型 的 已 标注 数据 。 
一 旦 一 个 新 的 病例 数据 输入 机 器 中 ， 机 器 束 可 以 马上 根据 已 有 的 数据 
做 出 一 个 比 有 经 验 的 医生 还 准确 的 判断 。 


图 5.11 疾 病症 状 之 间 相 关 性 的 超级 链接 


图 片 来 源 : CloudMedx lnc. 。 

同样 的 原理 也 适用 于 疾病 的 预测 和 预防 。 医 生 有 很 多 工具 预测 患 
者 的 健康 状况 ， 但 他 们 也 经 常 被 人 体 复杂 性 所 难 倒 ， 尤 其 是 心脏 病友 
作 是 很 难 预料 的 。 现 在 ， 科 学 家 已 经 证 明 能 够 运用 人 工 智 能 实现 比 标 
准 的 医疗 指南 更 有 效 的 预测 ， 能 大 大 提高 预测 的 准确 率 。 目 前 ， 各 国 
的 科学 家 已 经 在 大 脑 疾 病 、 心 脏 疾病 、 慢 性 病 、 心 脏 病 、 骨 关节 疾 
病 、 流 行 病 等 的 预测 研究 上 取得 较 好 的 成 果 。 随 着 这 些 方法 的 进一步 
成 熟 和 落地 ， 每 年 可 以 挽救 数 百 万 人 的 生命 。 


每 年 有 将 近 2 000 万 人 死 于 心血 管 疾病 ， 包 括 心 脏 病 、 中 风 、 动 脉 
阻塞 和 其 他 循环 系统 功能 障碍 。 许 多 医生 使 用 类 似 美国 心脏 病 学 会 / 美 
国 心脏 协会 (ACC / AHA) 的 指南 预测 这 些 病例 。 这 些 指南 基于 年 龄 、 
胆固醇 水 平和 血压 等 八 个 风险 因素 ， 经 过 医生 有 效 共 加 进行 预测 。 但 
这 种 方式 太 简 单 了 ， 不 能 涵盖 患者 可 能 使 用 的 许多 药物 ， 或 者 其 他 疾 
病 和 生活 方式 等 因素 。 并 且 一 些 因素 的 影响 是 违反 人 类 直觉 的 。 英 国 
诺丁汉 大 学 的 流行 病 学 家 斯 带 芬 。 全 (Stephen Weng) 说 : “生物 系 
统 中 有 很 多 因素 相互 影响 。 在 某 些 情况 下 ， 大 量 的 脂肪 实际 上 可 以 预 
防 心 脏 病 。” 么 和 他 的 团队 使 用 了 四 种 机 器 学 习 算法 ， 以 便 发 现 病历 
记录 和 心血 管 疾病 之 间 的 关联 ， 他 们 基于 英国 378 256 名 患者 的 电子 病 
历 训 练 了 人 工 智能 模型 。 与 ACC / AHA 指 南 不 同 ， 机 器 学 习 方 法 考虑 了 
22 个 影响 因素 ， 包 括 种 族 、 关 节 炎 和 肾脏 疾病 等 。 利 用 2005 年 的 记录 
数据 ， 他 们 预测 在 未 来 十 年 内 哪些 患者 会 有 第 一 次 心血 管 发 病 事件 ， 
并 对 2015 年 的 记录 进行 预测 。 四 种 机 器 学 习 方 法 的 表现 明显 好 于 
ACC/AHA 指 南 ， 通 过 AUC 的 统计 方法 (得 分 为 1 意味 着 100% 的 准确 
率 ) ，ACC/AHA 指 南 得 分 是 0.728。 这 四 种 机 器 学 习 方 法 的 得 分 介 于 
0.745 0.764。 最 好 的 一 个 神经 网 络 比 ACC/AHA 方 法 准确 率 高 7. 6%， 并 
且 它 减少 了 1. 6% 的 误 报 ， 在 大 约 83 000 条 记录 的 测试 样本 中 相当 于 可 
以 多 挽救 355 名 患者 的 生命 。 翁 说 这 是 因为 预测 结果 可 以 通过 降低 胆 固 
醇 的 药物 或 改变 饮食 来 预防 。 这 个 研究 发 现 ， 机 器 学 习 算 法 认定 的 最 
强 预 测 因 素 没 有 被 ACC / AHA 指 南 赛 括 ， 例 如 严重 的 精神 疾病 和 口服 皮 
质 类 固 醇 。 同 时 ，ACCV/AHA 列 表 中 没有 一 种 算法 将 糖尿 病 列 入 前 10 名 预 
测 指标 。 兮 希望 在 后 续 的 研究 中 算法 能 包含 其 他 生活 方式 和 遗传 因 
素 ， 以 便 进 一 步 提高 其 准确 性 。 


为 一 个 通过 和信 工 智能 预测 心脏 疾病 的 研究 机 构 也 取得 了 很 好 的 效 
果 。 英 国医 学 研究 委员 会 下 的 MRC 伦 吝 医 学 科学 研究 所 称 ， 人 工 智能 软 
件 通过 分 析 血 液 检 测 结果 和 心脏 扫描 结果 ， 可 以 肥 现 心脏 即将 隧 竭 的 
迹象 。 研 究 人 员 友 现 肺 内 血压 的 增高 会 损害 部 分 心脏 ， 大 约 1/3 的 患者 
会 在 确诊 之 后 的 五 年 内 死亡 。 目 前 的 治疗 方法 主要 是 直接 将 药物 注射 


到 血管 以 及 肺 移植 ， 但 是 ， 医 生 需 要 知道 患者 还 能 活 多 久 ， 以 便 选 择 
正确 的 治疗 方案 。 研 究 人 员 在 人 工 智能 软件 中 录入 了 256 名 心脏 病 患者 
的 心脏 核磁 共振 扫描 结果 和 血液 测试 结果 。 软 件 测量 了 每 一 次 心跳 
中 ， 心 脏 结构 上 标记 的 3 万 个 点 的 运动 状况 ， 把 这 个 数据 与 患者 八 年 来 
的 健康 记录 相 结 合 ， 人 工 智 能 软件 就 可 以 预测 哪些 异常 状况 会 导致 串 
者 的 死亡 。 人 工 智 能 软件 能 够 预测 未 来 五 年 的 生存 情况 ， 预 测 患 者 存 
活期 只 有 一 年 的 准确 率 大 约 为 80%， 而 医生 对 于 这 个 项 目的 预测 准确 率 
为 60%。 


目前 世界 上 超过 5 亿 人 患 有 不 同 的 肯 脏 疾病 ， 但 是 全 社会 对 于 慢性 
肾病 的 知晓 紊 不 足 10%， 因 为 慢性 肾病 早期 没有 明显 的 症状 ， 很 容易 被 
忽视 ， 很 多 患者 等 到 肯 功 能 恶化 时 才 去 就 医 ， 因 此 骨 病 分 级 预警 是 一 
件 很 急迫 的 事情 。 华 南 农业 大 学 食品 学 院 的 研究 员 兽 经 基于 人 工 乔 能 
对 肾 小 球 过 滤 进 行 预 测 ， 通 过 神经 网 络 构造 了 预测 模型 ， 从 而 最 终 构 
建 出 一 个 实用 性 良好 的 慢性 崩 病 分 型 预警 模型 。 


医疗 健康 诊断 和 预测 是 一 个 典型 的 上 蜡 知 识 案 例 。 一 个 疾病 的 原因 
非常 复杂 ， 每 个 病人 的 吴 体 情况 和 病史 又 都 不 同 。 人 生活 在 一 个 超级 
复杂 的 环境 中 ， 环 境 中 的 所 有 因素 都 对 人 的 健康 有 影响 。 过 去 的 医疗 
教育 是 把 这 些 非 常 复杂 的 情况 大 大 简化 ， 编 写成 各 种 教科 书 和 指南 ， 
但 这 些 明知 识 根本 无 法 履 盖 所 有 的 情况 ， 所 以 一 个 好 的 医生 主要 是 通 
过 多 年 实践 掌握 了 大 量 的 默 知识 。 但 由 于 人 体 的 复杂 性 ， 每 个 医生 笃 
握 的 默 知 识 只 是 一 点 皮毛 ， 无 论 是 广度 和 深度 都 远 远 不 够 。 只 有 机 器 
学 习 才 能 系统 地 通过 数据 挖掘 出 大 量 复杂 的 ， 医 生 通 过 上 自己 经 验 和 理 
解 都 无 法 触及 的 上 暗 知识 。 这 些 数据 不 仅 包 括 病人 的 数据 ， 也 包括 生 
物 、 和 药理、 生理、 气候、 环境 等 数据 ， 机 器 能 在 这 些 复杂 的 数据 中 找 
出 隐蔽 的 相关 性 。 机 器 将 发 现 越 来 越 多 的 医疗 健康 方面 的 暗 知识 ， 这 
不 仅 将 从 根本 上 改变 未 来 的 医疗 诊断 ， 也 将 深刻 影 啊 未 来 的 医学 教育 
和 医生 培养 。 


健康 过 理 


健康 管理 是 AI 在 医疗 领域 的 第 四 个 重要 应 用 。 移 动 智 能 终端 与 移 
动 互 联网 的 发 展 让 人 们 越 来 越 多 的 行为 以 数字 化 的 方式 被 记录 下 来 ， 
包括 医疗 就 诊 、 饮 食 营养 、 运 动 状况 、 睡 眠 时 间 、 社 交 、 生 命 体 征 等 
数据 。 而 人 工 智能 将 逐步 让 这 些 数据 释放 出 它们 应 有 的 价值 ， 基 于 数 
据 的 分 析 ， 提 供 更 为 健康 的 生活 方式 ， 通 过 帮助 人 们 管理 摄 入 饮食 的 
营养 成 分 、 生 活 方式 、 精 神情 绪 等 ， 让 健康 群体 对 自身 的 健康 实现 更 
具 前 脆性 的 管理 和 风险 预测 ， 让 亚 健 康 和 正在 康复 的 群体 获得 更 好 的 

Virta Health 是 由 加 利 福 尼 亚 大 学 戴 维 斯 分 校医 学 院 的 教授 斯 带 
分 。 菲 尼 (Stephen Phinney) 博士 和 俄亥俄 州立 大 学 的 教授 杰 夫 。 添 
羔 元 《Jeff Volek) 共同 创办 的 一 家 互联 网 慢性 病 管理 平台 。Virta 
Health 的 技术 平台 运用 了 AI 技术 ， 在 其 医生 和 健康 咨询 师 团 队 的 辅助 
下 ， 提 供 连 续 和 实时 的 医疗 文 持 ， 并 能 提出 精准 的 饮食 方案 ， 为 患者 
设计 出 个 体 化 的 碳水 化 合 物 摄 入 和 饮食 方案 。 当 患者 注册 成 为 Virta 
Health 的 会 员 后 ， 它 会 寄 给 患者 一 套 经 过 FDA 认 证 的 医疗 设备 ， 用 于 每 
日 血糖 、 血 压 和 体重 等 身体 指标 的 监测 。 在 监测 完成 后 ， 医 生根 据 当 
天 的 各 项 数据 ， 通 过 人 工 智 能 的 计算 给 患者 制定 出 个 性 化 的 饮食 方 
案 。Virta Health 还 设立 了 健康 教练 的 职位 ， 回 患者 提供 一 对 一 的 咨 
询 服务 ， 如 果 是 在 非 工 作 时 间 ， 那 么 语音 机 器 人 可 以 给 患者 回答 一 些 
答案 标准 度 高 的 医学 问题 。 此 外 ， 患 者 可 以 选择 加 入 在 线 社 区 ， 与 其 
他 病友 分 享 治疗 心得 ， 互 相 激 励 。Virta Health 与 印第安 纳 大 学 医学 
院 于 2016 年 开始 针对 262 位 [型 糖尿 病 患 者 展开 为 期 两 年 的 试验 ， 前 十 
周 就 已 经 取得 了 让 人 振奋 的 治疗 效果 。87% 的 患者 减少 胰岛素 的 注射 
量 ，56% 的 患者 糖化 血红 蛋白 含量 降 至 健康 水 平 ，75% 的 患者 体重 至 少 
减少 了 5%。 

美国 公司 Realeyes 使 用 计算 机 视觉 、 机 器 学 习 技术 ， 通 过 电脑 或 
智能 手机 摄像 头 跟 踩 用 户 面 部 表情 ， 评 佑 用户 的 情绪 变化 。 目 前 ， 


Realeyes 已 经 建立 了 超过 500 万 帧 的 人 脸 数 据 库 。 每 一 帧 都 有 多 达 7 个 
面部 动作 注解 ， 比 如 皱眉 意味 着 困惑 ， 而 眉毛 向 上 抬 起 则 表示 惊讶 。 
此 外 还 会 有 其 他 面部 特征 帮助 一 起 进行 情绪 识别 ， 使 分 析 结 果 更 有 说 
服 力 。Realeyes 正 在 研发 一 于 心理 健康 产品 ， 以 便 帮助 人 们 变 得 快乐 
并 且 保 持 快 乐 。 

随 痢 智能 手机 、 可 罕 戴 设备 中 传感器 的 丰富 ， 这 些 设备 已 经 可 以 
获取 用 户 在 不 同 场景 中 的 运动 数据 (跑步 、 瑜 如、 游泳 等 ， 睡 眠 质 
量 、 血 糖 、 心 率 、 心 电 图 、 血 氧 等 数据 ， 以 及 生活 场景 中 的 温度 、 空 
气 、 紫 外 线 等 数据 ， 从 而 为 人 工 智能 更 健康 地 管理 人 们 的 生活 提供 更 
全 面 精准 的 资料 。 


医疗 语 首 助理 


AI 在 医疗 领域 的 第 五 个 重要 应 用 是 医疗 语音 助理 。 医 疗 语音 助理 
目前 已 经 在 病历 录入 、 智 能 导 医 、 推 荐 用 药 等 环节 开始 商用 ， 和 帮助 医 
生 减 轻 工 作 压 力 ， 提 升 患者 的 束 医 体验 。 


病历 书写 花费 了 医生 相当 多 的 时 间 。 气 香港 德 信 2016 年 调查 数据 
显示 ， 中 国 50% 以 上 的 住院 医生 平均 每 天 用 于 写 病历 的 时 间 超 过 4 个 小 
时 ， 相 当 一 部 分 医生 写 病历 的 时 间 超 过 7 个 小 时 。 而 语 普 助 理 则 能 够 大 
幅 减少 写 病历 所 用 的 时 间 ， 医 生 的 口述 内 容 可 以 实时 转 写 成 文本 ， 录 
入 到 医院 信息 管理 软件 中 。 录 入 病历 的 效率 提高 以 后 ， 医 生 能 够 拥有 
更 多 时 间 问 诊 。 对 放射 科 等 特殊 科室 的 医生 来 说 更 是 效果 明显 。 放 射 
科 医 生 大 多 需要 在 2 个 屏幕 间 来 回 切 换 ， 一 会 看 片子 ， 一 会 进行 报告 记 
录 ， 有 了 语音 录入 ， 可 以 把 注意 力 放 在 片子 上 ， 边 看 边 说 ， 工 作 更 加 
流畅 ， 效 率 也 大 大 提高 。2016 年 8 月 ， 北 京 协和 医院 在 病房 、 手 术 室 、 
超声 科 、 放 射 科 等 全 部 上 线 “ 医 疗 智 能 语音 录入 系统 ”， 成 为 首 家 文 
持 语音 识别 的 公立 三 甲 医院 ， 这 和 套 系 统 的 语音 识别 准确 率 达 到 95% 以 
上 ， 个 别 科 室 的 准确 率 更 是 超过 98%。 


美国 语音 技术 公司 Nuance 推 出 的 虚拟 助手 Florence， 更 是 能 在 一 
定 程 度 上 理解 医生 口述 文件 ， 并 通过 洞察 发 现 来 提供 及 时 的 建议 ， 例 
如 药物 、 实 验 室 或 做 CT 的 订单 等 。Nuance 的 报告 显示 ，Florence 在 试 
点 阶段 就 为 医生 节省 了 35% 的 时 间 ， 而 现在 与 优化 之 前 相 比 节省 的 时 间 
超过 了 50%。 该 系统 还 将 20 个 订单 的 键 击 总 数 从 87 次 减少 到 零 。Nuance 
表示 ， 这 意味 着 仅仅 在 美国 的 药学 、 放 射 学 和 实验 室 订 单方 面 ， 一 年 
就 为 医生 节省 了 2 260 万 个 小 时 。 


智能 导 诊 机 器 人 也 开始 在 医院 中 应 用 。 路 过 大 堂 的 医生 或 服务 台 
人 员 经 常 被 患者 问 询 该 挂 哪个 科室 的 号 ， 有 无 主任 医师 ， 以 及 洗手 
间 、 开 水 房 的 位 置 。 数 据 显 示 ， 目 前 中 国 一 家 三 甲 医院 的 日 门诊 总 量 
平均 约 为 6 000 人 次 ， 即 便 10% 的 患者 问 询 这 些 问 题 ， 也 将 给 医院 带 来 
较 大 压力 ， 并 且 由 于 分 属 不 同 的 科室 和 专业 知识 的 局 限 ， 被 问 询 的 医 
生 或 护士 很 难 精 准 地 回答 。 而 智能 问 诊 机 器 人 在 云端 和 医院 的 各 个 系 
统 以 及 服务 商 的 知识 库 相 接 ， 能 够 通过 语音 或 显示 屏 轻松 准确 地 解答 
大 多 数 问题 ， 并 且 这 些 导 诊 机 器 人 还 能 听 懂 不 同 的 方言 和 外 语 ， 能 够 
解决 该 类 人 群 沟通 不 畅 的 问题 。 目 前 ， 科 大 讯 飞 的 机 器 人 “ 晓 曼 ”、 
进化 者 机 器 人 公司 的 机 器 人 “小 胖 ” 已 经 开始 在 北京 、 武 汉 等 地 的 医 
院 提 供 服 务 。( 见 图 5. 12 ) 


图 5.12 北 京 301 医 院 门诊 大 厅 内 的 智能 导 诊 机 器 人 


图 片 来 源 : 中 新 网 。 

还 有 一 个 语音 辅助 医疗 的 例子 是 荷兰 一 家 创业 公司 开发 的 接线 辅 
助 智能 系统 Corti。 该 系统 能 够 根据 患者 提供 的 信息 和 说 话 声音 ， 识 别 
患者 的 症状 ， 辣 急救 专业 人 员 进 行 提 示 ， 并 且 能 够 提醒 接线 员 询问 更 
为 详细 的 信息 。2016 年 12 月 ， 接 线 员 推 新 一 名 男士 在 事故 中 摔 倒 ， 被 
损坏 的 屋顶 磺 到 了 背部 ， 此 时 ，Corti 开 启 了 声音 识别 模式 ， 它 听 到 了 
微弱 的 震动 声 ， 患 者 虽然 心脏 又 停 但 还 在 试 着 呼吸 ，Corti 准 确 识 别 了 
这 小 场景 。 


智能 金融 将 导致 一 大 批 日 领 、 金 领 失业 


AI 将 给 金融 行业 融 来 彻底 的 颠覆 。 金 融 行 业 的 重要 分 文 例 如 银 
行 、 保 险 、 证 券 、 理 财 将 无 一 幸免 。 


银行 


全 球 银 行业 正在 受到 金融 科技 的 巨大 冲击 。 据 埃 森 哲 调 研 数据 显 
示 ， 消 费 者 正 以 每 年 两 位 数 的 增长 速度 从 传统 银行 迁移 到 互联 网 金 
融 。 超 过 一 半 的 调研 者 认为 目前 银行 基于 互联 网 金融 的 业务 收入 占 比 
低 于 10%。 挨 森 哲 预测 到 2020 年 银行 业 将 有 近 30% 的 营业 收入 受到 影 
响 。 

人 工 智 能 技术 作为 金融 科技 的 核心 技术 ， 正 在 使 银行 业 的 服务 形 
态 、 数 据 处 理 、 需 求 洞察 、 风 险 管理 等 发 生根 本 性 的 变革 。 


首先 ， 银 行 面 对 消费 者 的 大 量 业 务 和 服务 将 被 AI 取代 。 例 如 贷款 
的 审核 方面 ， 人 工 智能 可 以 在 贷 前 、 贷 中 、 贷 后 进行 客户 跟踪 管理 。 
根据 银行 的 征 信 数 据 加 上 社交 的 数据 行为 特征 ， 可 以 精准 地 描述 个 人 
行为 和 金融 风险 。 一 笔 贷 蒜 的 申请 和 审核 可 以 在 瞬间 完成 ， 并 且 比 人 
工 审 核 的 坏账 率 更 低 。 以 前 银行 做 小 额 信贷 很 少 ， 因 为 风险 太 大 ， 损 
失 率 太 高 ， 现 在 因为 人 工 智能 和 大 数据 ， 小 额 信 贷 开 始 甘 勃发 展 。 再 
比如 客服 方面 ， 汇 丰 银 行 、 恒 生 银 行 、 中 国平 安 银行 等 都 推出 了 智能 
语音 客服 ， 采 用 了 自然 语言 处 理 技术 ， 能 够 回答 客户 的 提问 。 根 据 美 
国 市 场 调 查 公 司 Juniper Research 〈 朱 尼 普 研究 公司 ) 测算 ， 与 传统 
的 呼叫 中 心 调查 相 比 ， 一 个 聊天 机 器 人 的 回答 将 节省 大 约 4 分 钟 。 预 计 
到 2022 年 ， 聊 天 机 器 人 将 帮助 全 球 银行 每 年 节省 80 亿 美元 。 

其 次 ，AI 将 取代 银行 内 部 的 大 量 人 工 运营 管理 工作 。 大 型 银行 必 
须 处 理 大 量 的 数据 以 便 生成 财务 报告 ， 并 满足 合 规 要 求 。 这 些 过 程 都 
越 来 越 规范 化 、 程 式 化， 但 仍 需要 大 量 人 员 进 行 添加 任务 ， 比 如 对 账 
和 合并 报表 ， 他 们 的 工作 是 机 器 人 过 程 自动 化 〈RPA) 的 理想 选择 。 


不 仅 如 此 ， 在 接 下 来 的 几 年 中 ， 人 工 智 能 将 被 用 于 改变 财务 中 最 
核心 的 功能 ， 例 如 公司 间 对 账 和 季报 ， 以 及 进行 财务 分 析 、 合 规 分 析 
等 更 具有 战略 性 的 职能 。AI 提 供 了 速度 和 准确 性 ， 例 如 ， 整 个 报告 和 
披露 过 程 可 以 和 真实 时 间 基 本 保持 同步 ， 不 用 再 等 到 每 个 季度 末期 。 
由 AI 文 撑 的 财务 团队 能 够 比 现 在 更 快 地 发 现 问 题 并 做 出 调整 ， 从 而 提 
高 准确 性 ， 而 非 每 个 季度 的 最 后 阶段 才 做 努力 。 例 如 器 国 的 Suade 公 司 
合 规 平台 能 够 满足 银行 时 刻 审 慎 的 监管 政策 ， 该 平台 能 够 自动 通过 数 
据 上 整理 生成 监管 报告 。 

风险 控制 对 银行 业 来 说 非常 重要 。 整 体 的 风 控 方面 也 开始 引入 越 
来 越 多 的 算法 。 以 前 银行 的 首席 风险 官 主要 紧 盯 资产 负债 表 来 控制 风 
险 ， 而 当前 随 着 数据 维度 的 增加 ， 负 债 表 、 收 益 表 、 库 存 、 流 量 、 企 
业 的 经 营 状况 都 被 纳入 其 中 ， 并 且 实 时 跟踪 挖掘， 不 用 等 到 资产 负债 
表 出 来 再 进行 调整 模型 ， 整 个 风险 的 管控 精准 度 比 以 前 大 大 提高 

银行 业 也 正在 借助 算法 来 迟 选 人 才 ， 同 时 减少 跳槽 员工 的 数量 。 
德意志 银行 2016 年 9 月 面 问 部 分 美国 大 学 毕业 生 局 用 一 套 角 选 系统 ， 访 
系统 由 一 家 硅谷 公司 Koru 设 计 。 参 与 德意志 银行 美国 企业 融资 职位 的 
候选 人 要 完成 该 系统 20 分 钟 的 行为 测验 ， 以 便 选 取 和 公司 表现 最 佳 的 
初级 员工 有 类 似 忠 诚 度 的 员工 。 负 责 该 项 目的 德意志 银行 董事 总 经 理 
诺 埃 尔 。 沃 尔 普 (Noel Volpe) 表示 ， 该 系统 则 在 发 现 “ 具 备 我 行 最 
优秀 、 最 聪明 人 才 身 上 的 某 些 特征 的 候选 人 ”。 他 相信 ， 与 各 银行 通 
常 况 相 争 夺 的 常 青 胶 大 学 候选 人 相 比 ， 新 的 测验 识别 出 的 招聘 对 象 将 
更 适合 该 行 ， 因 为 常青藤 大 学 的 毕业 生 往 往 没 有 忠诚 意识 。 人 花旗 集 
二、 高 盛 也 在 试 运行 自己 的 版 本 。 

面 对 金 融 科技 带 来 的 竞争 力 和 紧迫 感 ， 银 行 除了 变革 业务 架构 和 
将 技术 融入 业务 之 中 ， 一 定 要 重视 自身 的 天 然 优 势 一 一 既 有 的 用 户 和 
数据 。 麦 肯 锡 研究 报告 以 银行 业 为 例 指 出 ， 银 行业 每 产生 100 万 美元 的 
收入 ， 束 会 产生 8206GB 的 数据 。 金 融 行 业 在 发 展 的 过 程 中 积累 了 大 量 的 
数据 ， 包 括 客户 信息 、 交 易 信 息 、 资 产 负债 信息 等 。 


图 5. 13 是 不 同行 业 每 产生 100 万 美元 收入 所 产生 的 数据 量 。 随 着 软 
件 功能 的 增强 和 传感器 成 本 的 降低 ， 单 位 收入 所 产生 的 数据 还 会 大 大 
增加 。 


交易 信息 、 账 户 信息 、 身 份 特征 信息 和 行为 数据 构成 了 未 来 金融 
业 基 础 核心 数据 的 金 矿 。 截 到 目前， 包括 网 络 银行 所 用 的 数据 在 内 ， 
银行 业 使 用 的 数据 只 占 现存 数据 的 不 到 10%。 银 行 只 有 结合 用 户 在 互联 
网 上 的 行为 特征 ， 深 度 挖掘 既 有 的 数据 ， 才 能 更 好 地 午 握 和 吸引 用 
户 ， 并 为 他 们 带 来 更 好 的 服务 体验 。 
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电信 460 
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图 5.13 不 同行 业 每 产生 100 万 美元 收入 所 产生 的 数据 量 
图 片 来 源 : 麦肯锡 报告 。 


保险 
以 人 工 智 能 、 大 数据 、 区 块 链 等 技术 为 核心 的 InsurTech《〈 保 险 科 


技 ) 正在 重新 定义 保险 产业 。 保 险 业 务 从 产品 设计 ， 售 前 (咨询 、 推 
荐 、 关 怀 ) ， 承 保 〈 认 证 、 核 保 、 定 价 ) ， 理 赔 ( 反 欺诈 、 核 损 、 赔 


付 ) ， 售 后 服务 〈 客 服 、 日 党 分析 、 客 户头 系 管 理 ) ， 以 及 营销 和 风 
险 控 制 方面 都 在 重 构 。 

在 产品 创新 方面 ， 通 过 AI 可 以 精准 发 掘 潜在 的 保险 需求 ， 提 供 定 
制 化 保险 产品 。 旧 金山 的 一 家 汽车 保险 公司 Metromile 打 破 传统 车 险 的 
固定 收费 模式 ， 利 用 手机 App《〈 应 用 程序 ) 及 大 数据 运算 营 握 用 户 的 开 
车 里 程 数 ， 并 根据 收集 到 的 资料 实施 定制 化 收费 ， 让 用 户 根 据 开 车 行 
为 及 情况 更 公平 地 支付 保费 。Metromile 认 为 65% 的 车 主 都 支付 了 过 高 
的 保费 以 便 补 贴 少数 开车 最 多 的 人 ， 因 此 它们 抓 住 传统 车 险 模 式 中 的 
这 个 痛 点 ， 推 出 按 量 计 费 的 新 形态 车 险 ， 实 现 里 程 维 度 上 的 个 性 化 定 
价 。Metromile 提 供 的 车 险 由 基础 费用 和 按 里 程 变动 费用 两 部 分 组 成 。 
其 计算 公式 为 每 月 保费 总 额 = 每 月 基础 保费 + 每 月 行车 里 程 X 单 位 里 程 
保费 。 其 中 基础 保费 和 单位 里 程 保费 会 根据 不 同 车 主 的 情况 有 所 不 同 
(如 年 龄 、 车 型 、 驾 车 历史 等 ) ， 基 础 保费 一 般 在 15 40 美 元 ， 按 里 程 
计 费 的 部 分 一 般 是 2 6 美 分 / 英里 。Metromile 还 设置 了 保费 上 限 ， 当 
日 里 程 数 超 过 150 英 里 (华盛顿 地 区 是 250 英 里 ) 时 ， 超 过 的 部 分 不 需 
要 再 多 交 保 费 。2017 年 特 斯 拉 也 宣布 今后 将 自己 提供 汽车 保险 。 因 为 
特 斯 拉 有 每 辆 车 的 痪 驶 数据 ， 它 可 以 为 每 辆 车 制定 个 性 化 保险 产品 ， 
这 样 的 “保险 精算 ”是 任何 传统 保险 公司 都 望尘莫及 的 。 


保险 营销 创新 ， 现 在 通过 大 数据 的 应 用 ， 平 台 可 以 对 数据 进行 比 
较 ， 帮 助 客户 选择 保险 。 比 如 有 一 于 应 用 Denim， 为 保险 公司 提供 社交 
推广 平台 ， 通 过 数据 分 析 为 保险 公司 精确 引流 客户 。 

保险 管理 平台 的 创新 ， 比 如 Apliant 就 是 一 家 为 代理 人 提供 管理 平 
台 的 软件 ， 提 高 代理 人 的 服务 效率 以 及 服务 水 平 。 


在 承保 方面 ， 南 非 农 业 数 据 分 析 平 台 Aerobotics 公 司 通过 无 人 机 
来 获取 农业 、 物 流 、 矿 产 等 行业 的 数据 ， 以 此 来 评定 风险 等 级 ， 提 升 
公司 效率 。 硅 谷 的 财产 保险 公司 Cape Analytics 则 是 利用 机 器 学 习 和 
高 空 摄像 技术 来 为 投保 人 的 财产 进行 风险 等 级 测评 。 其 高 空 成 像 技 术 
可 以 检测 出 不 同 的 时 间 内 ， 同 一 空间 内 物体 的 改变 情况 。 


在 理赔 方面 ，2017 年 6 月 ， 紧 蚁 金 服 基于 图 像 识别 检测 技术 与 人 工 
智能 推出 了 “ 定 损 室 ”， 只 需 按 要 求 将 拍摄 的 照片 上 传 ， 定 损 宝 就 能 
用 云端 服务 器 的 算法 模型 根据 用 户 上 传 的 图 片 进行 判定 ， 生 成 解决 方 
案 ， 该 类 产品 能 够 在 理赔 服务 流程 中 降低 成 本 。 目 前 在 保险 业 中 ， 的 
有 10 万 人 从 事 查 勘定 损 的 工作 。 实 现 自动 定 损 之 后 ， 预 计 可 以 减少 查 
勘定 损人 员 50% 的 工作 量 。 美 国 财产 保险 公司 Dropin 更 是 开发 了 一 个 
直播 平台 ， 保 险 公 司 可 以 从 无 人 机 或 用 户 手机 端 获取 事故 现场 的 实时 
视频 并 以 此 为 依据 ， 远 程 定 损 。 


当前 保险 科技 参与 主体 按照 经 营 特点 分 为 三 类 ， 分 别 是 传统 保险 
公司 、 互 联网 保险 公司 和 技术 服务 公司 。 全 球 已 经 有 超过 1 300 家 保险 
初创 企业 ， 大 多 数 通过 更 为 精准 的 产品 设计 或 者 全 流程 的 金融 科技 提 
供 服务 。 加 之 阿里 巴巴 、 腾 讯 、 百 度 等 科技 巨头 进军 保险 行业 ， 这 对 
于 传统 保险 公司 无 疑 形成 了 较 大 的 压力 。 普 华 永 道 调研 显示 ， 保 险 行 
业 对 金融 科技 颠 履行 业 的 担忧 正在 减弱 。2017 年 大 部 分 受 访 者 〈56%) 
预计 其 业务 收入 的 1% 20% 可 能 受到 保险 科技 公司 的 威胁 。“〈 见 图 
5. 14) 


2016 2017 
0% 89%~100%| 1% 
0% 61%~80% 轩 3% 
10% 41%-~60%@ 
22% 21%~40% 时 5 
7 1%-20y EE 


图 5.14 未 来 五 年 内 ， 可 能 被 保险 科技 公司 抢 走 的 业务 收入 占 比 
图 片 来 源 : 普 华 永 道 报告 。 

但 多 数 传统 保险 公司 的 前 途 依然 堪忧 。 人 工 智能 对 保险 的 颠覆 会 
来 得 更 加 迅 独 ， 因 为 保险 是 以 场景 为 基础 的 ， 人 工 智能 的 技术 就 是 以 
场景 为 基础 处 理 特殊 的 任务 。 阿 里 巴巴 、 腾 讯 、 百 度 等 互联 网 公司 通 
过 线 上 服务 比较 精准 地 掌握 了 用 户 的 出 行 、 和 餐饮 、 娱 乐 、 就 医 、 社 保 


等 场景 数据 ， 通 过 挖掘 数据 来 推销 的 准确 率 要 大 大 高 于 保险 销售 员 的 
地 推销 率 。 并 且 在 人 工 智 能 技术 和 信息 服务 平台 上 ， 传 统 的 保险 公司 
也 并 不 占 优势 。 互 联网 公司 能 联动 互联 网 的 参与 方 (例如 互联 网 电 
商 、 互 联网 社交 、 互 联网 金融 等 公司 及 客户 ) 骨 入 互联 网 背后 的 物 
流 、 文 付 、 消 费 者 保障 等 环节 ， 创 造 新 的 互联 网 保险 产品 ， 并 实现 从 
保险 产品 的 购买 到 理赔 全 在 线 上 进行 ， 比 如 ， 阿 里 巴巴 根据 用 户 在 其 
电 丙 平台 购买 紧 喘 牛仔 链 等 行为 推荐 手机 碎 屏 险 。 


证 券 


计算 机 目 动 化 交易 方兴未艾 ， 更 新 换代 进程 不 断 加 速 ， 曾 经 由 人 
类 主宰 的 金融 领域 ， 也 正 发 生 着 巨大 的 变革 。2000 年 ， 高 盛 在 纽约 总 
部 的 美国 现金 股票 交易 柜台 雇用 了 600 名 交易 员 ， 为 投资 银行 的 大 客户 
买卖 股票 。 但 今天 ， 这 里 只 剩 下 两 名 交易 员 ， 由 200 名 计算 机 工程 师 文 
持 的 自动 交易 程序 已 经 接管 了 其 余 的 工作 。 


融合 机 器 学 习 的 复杂 的 交易 算法 首先 取代 了 市 场 上 很 容易 确定 价 
格 的 交易 ， 包 括 高 盛 以 前 的 600 名 交易 员 操 作 的 股票 。 目 前 一 些 复杂 的 
交易 如 货币 和 信贷 交易 ， 并 不 在 证 券 交 易 所 交易 ， 而 是 通过 不 太 透 明 
的 交易 者 网 络 进行 交易 ， 但 即 是 这 些 复杂 交易 也 正在 实现 目 动 化 。 

跟踪 金融 行业 走 癌 的 英国 公司 Coalition 表 示 ， 当 前 将 近 45% 的 交 
易 都 通过 电子 渠道 完成 。 在 裁员 压力 下 处 理 日 常 运作 事务 的 职员 首 当 
其 冲 ， 不 光 是 高 右 ， 越 来 越 多 的 银行 加 入 了 裁员 的 浪潮 之 中 。 瑞 银 集 
团 CE0 塞 尔 吉 奥 ， 埃 尔 莫 提 (Sergio Ermotti) 接受 采访 时 称 ， 随 着 银 
行业 的 科技 进步 ， 未 来 数 年 该 行 可 能 裁员 近 3 万 人 ， 占 公司 人 员 的 
30%。 

面 对 来 自 人 工 智能 的 竞争 ， 就 连 许 多 高 薪 人 士 都 将 失业 。 目 前 ， 
高 盛 有 9 000 名 工程 师 ， 占 总 员工 的 1/3。 接 下 来 ， 将 有 更 多 高 层级 的 
工作 被 自动 化 ， 高 盛 计划 让 IP0《〈 首 次 公开 筋 股 ) 过 程 中 约 146 个 步骤 


获得 上 自动化， 但 传统 工作 上 专注 于 推销 和 建立 人 际 关 系 等 岗位 还 暂时 
不 会 被 取代 。 


图 5.15 八 年 前 瑞 银 集团 的 交易 大 厅 


图 片 来 源 : https://www. zerohedge. com/news/2016-12-20/wor1ds-largest- 
trading-floor-sale。 
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图 5.16 如 今 瑞 银 集团 的 交易 大 厅 


图 片 来 源 : https://www. zerohedge. com/news/2016-12-20/wor1ds-largest- 
trading-floor-sale。 


智能 投资 顾问 最 早 在 2008 年 左右 兴起 于 美国 ， 又 称 机 器 人 投资 顾 
问 (Robo-Advisor) 。 依 据 现代 资产 组 合理 论 ， 结 合 个 人 投资 者 的 风 
险 偏好 和 理财 目标 ， 利 用 算法 和 友好 的 互联 网 界面 ， 为 客户 提供 财富 
管理 和 在 线 投资 建议 服务 。 


根据 美国 金融 监管 局 (FINRA) 2016 年 3 月 提出 的 标准 ， 理 想 的 智 
能 投 顾 服务 包括 客户 分 析 、 大 类 资产 配置 、 投 资 组 合 选择 、 交 易 执 
i 分 析 。 传 统 投 顾 和 智能 投 顾 都 是 基 
于 以 上 七 个 步 又， 只 是 实施 的 方式 不 同 ， 而 智能 投 顾 本 质 上 是 技术 代 
蔡 人 工 实现 投 顾 。 但 相对 于 公司 职员 ， 智 能 顾问 的 优势 是 ， 它 可 以 不 
知 疲倦 地 监控 投资 组 合 的 表现 ，24 小 时 不 停 欣 地 工作 ， 还 可 以 对 所 有 
的 投资 组 合同 等 对 待 。 最 重要 的 是 它 大 幅 降 低 了 成 本 ， 因 为 机 器 人 服 


务 的 使 用 ， 美 国 以 前 以 50 万 “100 万 美元 为 起 点 的 理财 产品 今天 降低 到 5 
万 美元 ， 费 用 从 5% 降 到 0. 3% >0. 5%。 


据 权 威 在 线 统计 数据 门户 Statista 数 据 显 示 ，2017 年 全 球 智能 投 
顾 管理 资产 超过 2 248 亿 美元 ， 年 增长 率 高 达 47. 5%， 到 2021 年 全 球 智 
能 投 顾 管理 资产 规模 将 超过 1 万 亿美 元 。 〈 见 图 5. 17) 


2015 年 ?3 月， 嘉信 理财 (Charles Schwab) 推出 了 免 咨 询 费 的 智能 
投 顾 平台 的 Intelligent Portfolios。 该 投 顾 平台 能 够 覆盖 高 达 20 种 
不 同 的 资产 ， 根 据 不 同 投资 者 的 需求 、 风 险 偏好 、 收 入 水 平 ， 通 过 后 
台 运 算 来 制定 投资 组 合 。 受 托管 理 规 模 的 快速 上 涨 说 明 其 智能 投 顾 体 
系 在 一 定 程度 上 能 够 吸引 客户 ， 给 公司 带 来 增 量 收 入 ， 优 化 收入 结 
构 。 截 至 2017 年 第 二 季度 ， 公 司 智 能 投 顾 平 台 总 共 受 托管 理 客户 资产 
194 亿 美元 ， 较 上 年 同期 上 涨 137%， 较 第 一 季度 环比 上 涨 22%。 这 个 智 
能 投 顾 平台 的 鳃 利 模 式 主要 是 来 自 嘉 信 交 易 型 指数 基金 ETF 产 品 的 管理 
费 、 为 第 三 方 发 行 的 被 选 入 智能 投 顾 组 合 的 ETF 产 品 的 服务 费 、ETF 申 
购 赎 回 等 交易 费用 ， 以 及 一 些 类 似 货 币 基 金 产品 的 收益 。 就 文 出 成 本 
而 言 ， 其 平均 受托 管理 资产 的 支出 成 本 远 低 于 其 他 大 型 经 纪 商 和 投资 
银行 。 
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图 5.17 智 能 投 顾 管理 资产 总 额 
数据 来 源 : Statista。 


日 盛 证 券 在 2017 年 11 月 推出 AI 理 财 机 器 人 一 一 AI 理 财 狼 ， 可 以 为 
投资 人 提供 线 上 24 小 时 即 问 即 答 服 务 ， 上 线 2 个 月 就 吸引 超过 万 名 投资 
人 尝试 ， 发 问 次 数 4 万 多 次 ， 使 用 程度 相当 活跃 。 

对 证 券 公 司 、 投 资 银 行 来 说 ， 裁 员 意 味 着 更 丰厚 的 利润 。 根 据 联 
盟 研究 统计 ， 在 销售 、 交 易 和 研究 领域 ， 全 球 12 个 最 大 的 投资 银行 员 
工 的 平均 薪酬 为 50 万 美元 ， 包 括 薪资 和 奖金 。 而 联盟 研究 主管 Amrit 
Shahani 〈 安 称 立 特 。 沙 哈尼 ) 说 ， 华 尔 街 75% 的 薪酬 给 了 那些 高 薪 的 
“前 端 ” 员 工 。 一 旦 这 些 交 易 员 被 机 器 取代 ， 他 们 以 前 获得 的 薪酬 就 
将 直接 计 入 公司 利润 。 这 同时 也 引发 了 人 们 对 失业 的 担忧 ， 因 为 曾经 
光鲜 亮丽 的 部 分 华尔街 精英 也 难 逃 这 次 冲击 。 


智能 时 代 万 物 旨 媒 ， 人 机 协作 时 代 已 经 
来 临 


人 工 智能 正在 彻底 重 塑 媒体 产业 ， 线 索 、 策 划 、 采 访 、 生 产 、 分 
发 、 肥 人 馈 等 全 新 闻 链 路 都 因为 人 工 乔 能 的 到 来 而 发 生变 革 ， 媒 体 也 正 
在 走 癌 智 媒 时 代 。 人 工 智 能 不 仅 能 够 帮助 媒体 从 业者 更 快 地 及 现 线 
索 ， 辅 助 或 自主 生产 新 闻 ， 并 能 根据 每 个 受众 的 喜好 有 针对 性 地 分 友 
新 闻 ， 同 时 它 能 为 商家 匹配 更 精准 的 广告 ， 让 媒体 更 好 地 实现 商业 
化 。 


目 动 化 写作 


目前 的 自动 化 写作 已 经 得 到 较 广 泛 的 应 用 ， 最 初 多 以 财经 和 体育 
新 闻 的 快讯 、 短 讯 及 财报 为 主 ， 因 为 这 些 报道 一 般 能 够 较 好 地 拿 到 结 
构 化 的 数据 。 随 着 技术 的 发 展 ， 目 动 化 写作 机 器 人 的 能 力 开 始 履 盖 选 
题 、 写 稳 、 校 对 等 全 方位 的 功能 ， 题 材 也 拓展 到 灾难 、 犯 罪 、 选 举 等 
领域 。 而 且 时 间 更 快 ， 还 可 以 定制 。( 见 表 5. 3) 


表 5.3 新 闻 机 器 人 发 展 大 事 记 


公 局 做 法 
美国 汤姆 森 公 司 用 机 上 人 记者 撰写 经 济 和 金融 
方面 的 新 闻 


汤姆 条 


路 透 社 路 透 社 的 Open Calais 在 校对 界 大 显 身 手 
Narrative Science 公司 机 需 人 用 算法 把 数据 转化 
成 财经 和 房地产 报道 


一 一 =- 一 天 一 1 ZL i LT 人 Hl LN 一 一 > 一 上 Err EC 上 一 = 一 <- 


Narrative Sclence 


20U12 咎 


《 和平 壁 血 邮 报 》 


《 平 属 曙 邮 报 》 刹 团 人 饮食 负 佑 八 lruth leller 


AI 公司 的 机 器 人 Wordsmith 针对 读者 生产 定制 


2014 年 Wordsmith 

版 内 容 
《洛杉矶 时 报 》 机 右 人 Quakebot 在 地 震 发 生 3 
分 钟 后 自动 生成 和 发 布 了 报道 。 除 了 灾难 新 闻 ， 

2014 年 3 月 | 《洛杉矶 时 报 》 、 
《洛杉矶 时 报 》 还 开发 出 快速 发 布 犯罪 新 闻 的 机 
人 稻 人 

2014 年 4 月 《 卫 报 》 机 器 人 生产 出 靠 算法 编辑 的 纸 质 报纸 


美 联 社 全 面 利 用 机 器 人 Wordsmith 写作 ， 仅 需 
0.3 秒 就 可 以 撰写 、 发 布 上 市 公司 人鱼 利 报道 ， 还 


能 定制 多 种 语言 风格 

法 国 《 世 界 报 》 和 Syllabs 公司 合作 ， 用 机 器 人 
2015 年 ”| 法 国 《世界 报 》 

记者 报道 了 选举 活动 

《纽约 时 报 》 的 机 器 人 编辑 Blossom 每 天 会 从 
2015 年 8 月 | 《纽约 时 报 》 | 300 多 篇 文章 中 挑 出 “潜力 股 ”， 推 荐 给 编辑 。 

其 平均 点 击 量 是 普通 文章 的 38 售 

腾讯 财经 推出 了 国内 第 一 篇 由 Dreamwriter 撰写 
2015 年 9 月 | 《腾讯 财经 》 

的 “机 器 人 新 闻 ” 

新 华 社 推出 “ 快 笔 小 新 ”， 从 事 体 育 和 经 济 信息 
2015 年 11 月 新 华 社 


报道 


RE 做 法 

第 一 财经 联合 推出 “DT 稿 王 ”， 其 写 稿 多 、 
快 、 好 

今日 头条 推出 Xiaomingbot ( 张 小 明 ), 实时 撰写 


阿里 巴巴 


今日 头条 
里 约 奥运 会 新 闻 稿 件 


《华盛顿 邮 报 》 采 用 写 稿 软 件 Heliograf 报道 里 约 
《华盛顿 邮 报 》| 奥运 会 ， 几 秒 即 可 生成 并 发 布 一 条 Twitter ( 推 
特 ) 新 闻 


数据 来 源 : 中 国人 民 大 学 新 闻 坊 。 


美 联 社 是 自动 化 新 闻 最 早 的 探索 者 之 一 。2013 年 夏天 ， 美 联 社 的 
新 闻 部 门 负 责 人 提出 一 个 在 当时 看 来 略 显 激进 的 想法 一 一 引入 人 工 智 
能 进行 自动化 新 闻 创 作 。 几 个 月 后 ， 在 Automated Insights (研究 新 
闻 上 自动 生成 的 技术 公司 ， 位 于 美国 北 卡 罗 来 纳 州 ) 的 技术 文 持 下 ， 美 
联 社 获得 了 通过 机 器 目 动 生产 新 闻 的 能 力 ， 从 体育 新 闻 人 简报 起 步 ， 在 
2014 年 开始 使 用 算法 自动 生成 财报 报道 。 美 联 社 当 时 估计 这 个 做 法 能 
释放 记者 20% 的 时 间 ， 可 以 让 这 些 记者 从 事 更 为 复杂 和 关键 的 工作 。 
2015 年 ， 美 联 社 制定 了 一 个 五 年 2015 一 2020 年 ) 战略 规划 。 美 联 社 
战略 及 企业 发 展 部 高 级 副 总 裁 Jim Kennedy (吉姆 。 上 肯尼迪 ) 希望 在 
2020 年 之 前 ， 美 联 社 80% 的 新 闻 内 容 生产 都 能 实现 自动 化 。 美 联 社 全 
球 商 业 编 辑 Lisa Gibbs《 丽 莎 。 吉 布 斯 ) 说 : “通过 自动 化 ， 美 联 社 
加 客户 提供 的 公司 财报 发 布 报道 是 以 前 的 12 倍 ， 其 中 包括 许多 从 未 受 
到 什么 关注 的 非常 小 的 公司 。 利 用 这 些 释 放出 来 的 时 间 ， 美 联 社 记者 
可 以 参与 更 多 用 户 生 成 的 内 容 ， 制 作 多 媒体 报道 ， 妃 踪 调 查 报道 ， 并 
专注 于 更 复杂 的 新 闻 。” 

腾讯 是 中 国 自动 化 新 闻 最 早 的 尝试 者 。 中 国 的 自动 化 新 闻 为 什么 
比 海外 晚 了 将 近 十 年 ? 除了 我 国 媒 体 自 喘 意愿 和 人 员 成 本 比 西方 国家 
低 以 外 ， 西 方 媒体 更 侧重 于 和 技术 公司 合作 ,例如 德国 的 AX 


Semantics、 美 国 的 Narrative Science、 法 国 的 SYLLABS 和 LABSENCE、 
英国 的 Arria 等 为 媒体 提供 了 解决 方案 或 技术 文 撑 ， 而 中 国 的 媒体 大 多 
自行 研究 机 器 写作 技术 。2015 年 9 月 ， 腾 讯 财经 开发 的 机 器 人 
Dreamwriter 发 布 了 一 篇 天 于 8 月 CPI1 (居民 消费 价格 指数 ) 的 稿件 
一 一 《8 月 CPI 同 比 上 涨 2. 0% 创 12 个 月 新 高 》。 如 图 5. 18 所 示 ， 稿 件 分 
为 两 部 分 ， 第 一 部 分 是 数据 本 里， 第 二 部 分 是 各 界 人 士 对 数据 的 分 析 
解读 。 之 后 ，Dreamwriter 持 续 发 布 新 闻 稿 件 ， 根 据 《 中 国 新 媒体 趋势 
报告 2016》 数 据 显 示 ，2016 年 第 三 季度 ， 腾 讯 财经 机 器 人 写作 文章 的 
数量 达到 了 4 万 篇 。 

Dreamwriter 写 作 的 整个 流程 主要 包括 数据 库 的 建立 、 机 器 对 数据 
库 的 学 习 、 就 具体 项 目 进行 写作 、 内 容 审核 、 分 发 5 个 环节 。 腾 讯 要 先 
通过 购买 或 自己 创建 数据 库 ， 然 后 让 Dreamwriter 对 数据 库 内 的 各 项 数 
据 进 行 学 习 ， 生 成 相对 应 的 写作 手法 ， 全 部 学 习 完 之 后 便 可 以 进行 与 
数据 库 相 关联 的 新 闻 事 件 的 报道 写作 ， 写 作 完 成 后 进入 审核 环节 ， 最 
后 通过 腾讯 的 内 容 发 布 平台 到 达 用 户 端 。 (如 图 5. 19) 


8 月 CPI 同比 上 涨 2.0% 创 12 个 月 新 高 


腾讯 财经 讯 国家 统计 局 周 四 公布 数据 显示 ，8 月 CPI 同比 上 涨 2.0%， 涨幅 比 7 
月 的 1.6% 略 有 扩大 ， 但 高 于 预期 值 1.996， 并 创 12 个 月 新 高 。 


国家 统计 局 城市 司 高 级 统计 师 余 秋 梅 认为 ， 从 环比 看 ，8 月 份 猪 肉 、 鲜 菜 和 和 蛋 
等 视频 价格 大 幅 上 涨 ， 是 CPI 环比 涨幅 较 高 的 主要 原因 。8 月 份 猪肉 价格 连续 第 四 
个 月 恢复 性 上 涨 ， 环比 涨幅 为 7.79%6， 影 响 CPI 上 涨 0.25 个 百分点 。 部 分 地 区 高 温 、 
暴雨 天 气 交 替 ， 影 响 了 鲜 菜 的 生产 和 运输 ， 鲜 菜 价格 环比 上 涨 6.8%， 影 响 CPI 上 涨 
0.21 个 百分点 。 蛋 价 环比 上 涨 10.2%， 影 响 CPI 上 涨 0.08 个 百分点 ,但 8 月 价格 仍 
低 于 去 年 同期 。 猪 肉 、 鲜 菜 和 和 蛋 三 项 合计 影响 CPI 环比 上 涨 0.54 个 百分点 。 超 过 8 
月 CPI 环比 总 涨幅 。 


他 表示 ， 从 同比 看 ，8 月 份 CPI 同比 上 涨 2.0% ,涨幅 比 上 月 扩大 0.4 个 百分点 ， 
主要 原因 是 视频 价格 同比 涨幅 有 所 扩大 。8 月 份 ， 食品 价格 同比 上 涨 3.7%， 涨幅 比 
上 月 扩大 1.0 个 百分点 ， 其 中 猪肉 、 鲜 菜 价 格 同比 分 别 上 涨 19.6% 和 15.99%%， 合 计 影 
响 CPI 上涨 1.05 个 百分点 。 非 食品 价格 同比 上 涨 1.1%， 涨幅 与 上 月 相同 ,但 家 庭 服 
务 、 烟 草 、 学 前 教育 、 公 共 汽 车 票 和 理发 等 价格 涨幅 仍然 较 高 ， 涨 幅 分 别 为 7.4%、 
6.8% 、5.6% 、5.3% 和 5.2%。 


图 5.18 腾 讯 写作 机 器 人 生成 的 财经 报道 
图 片 来 源 : 腾讯 新 闻 。 


图 5.19 机 器 写作 的 流程 
图 片 来 源 : 中 国人 民 大 学 新 闻 坊 。 
自动 化 写作 无 论 是 对 新 闻 行 业 还 是 对 读者 来 说， 都 市 来 了 显 而 易 
见 的 好 处 。 对 新 闻 工 作者 来 说 ， 他 们 可 以 把 程式 化 、 重 复 化 的 劳动 交 


给 机 器 ， 目 己 进行 更 深度 的 忠 考 与 写作 ， 并 且 在 写作 过 程 中 能 够 得 到 
人 工 智 能 的 支撑 ， 写 作 后 有 系统 校对 。 对 读者 来 说 ， 这 些 新 闻 最 重要 
的 需求 是 快 ， 对 于 体育 、 财 经、 地 震 等 对 时 效 性 要 求 极 高 的 报道 显得 
更 为 明显 。 田 外， 满足 用 户 对 长 尾 内 容 与 个 性 化 内 容 的 需求 ， 在 传统 
新 闻 理 论 中 ， 某 些 冷 门 比赛 的 报道 价值 不 大 ， 但 实际 上 依然 有 可 观 的 
阅读 量 ， 比 如 棒球 比赛 对 于 中 国 棒球 球迷 ， 乒 乓 球 比赛 对 于 美国 乒乓 
球 球迷 。 


随 大 上 自动 化 新 闻 数 量 的 增多 和 深度 的 加 强 ， 其 背后 算法 的 设 定 就 
开始 受到 怀疑 。 昌 然 大 多 数目 动 化 新 闻 设 定 了 审核 环节 ， 但 是 在 实际 
操作 过 程 中 ， 为 了 时 效 性 ， 大 多 数 并 没有 经 过 人 工 审 核 。 这 样 可 能 
现 的 后 果 是 ， 一 个 错误 的 稿件 可 以 瞬间 发 给 百 万 级 的 用 户 。 谷 歌 技术 
孵化 喜 Jigsaw 的 沟通 负责 人 丹 。 肯 瑟 琳 称 : “算法 容易 产生 偏见 ， 就 
像 人 类 一 样 。 我 们 需要 以 在 新 闻 报 着 中 处 理事 实 的 谨慎 来 对 符 数 字 。 
它们 需要 被 检查 ， 它 们 需要 被 确认 ， 它 们 的 背景 需要 被 理解 。” 这 就 
要 求 新 闻 工 作者 不 仅 要 参与 部 分 内 容 的 审核 ， 还 要 和 算法 工程 师 一 
道 ， 让 机 器 拥有 更 准确 的 表述 能 力 和 价值 观 。 


辅助 写作 


智 媒 时 代 不 是 人 工 智 能 对 新 闻 工 作者 的 珍 代 。 相 反 ， 人 工 乔 能 结 
合 互 联网 更 好 地 连接 了 人 与 人 ， 更 好 地 汇聚 人 的 智慧 ， 并 拓展 了 人 的 
能 力 。 在 未 来 的 新 闻 行 业 里 ， 记 者 和 人 工 智能 形成 “人 机 联姻 ”的 生 
产 模式 。 算 法 分 析 数 据 、 发 现 有 趣 的 故事 线索 ， 记 者 进行 复杂 变量 的 
处 理 和 判断 ， 微 妙 情感 关系 的 处 理 和 表达 ， 和 采访 重要 人 物 以 及 幕后 故 
事 的 发 掘 等 ， 在 人 执行 的 每 一 步 工作 流程 中 人 工 智 能 都 将 有 一 定 的 参 
与 。 


1. 语音 识别 技术 在 新 闻 工 作 中 广泛 使 用 


语音 识别 技术 能 使 记者 减少 每 天 必须 完成 的 日 常任 务 。 传 统 的 新 
闻 采 访 后 的 录音 整理 是 一 项 特别 耗 时 耗 力 的 工作 ， 据 雷诺 北新 闻 研 究 
所 (CRJI) 最 近 对 美国 超过 100 名 记者 进行 的 调查 显示 ， 记 者 每 周平 均 
花费 3 个 小 时 访问 采访 对 象 ， 并 花 一 倍 的 时 间 把 采访 的 录音 整理 出 来 。 
然而 通过 语音 识别 技术 ， 可 以 轻松 完成 这 项 工作 ， 国 内 新 闻 工 作者 开 
始 借 助 讯 飞 语 记 等 应 用 减少 工作 负担 。RJI 未 来 实验 室 开发 的 一 个 带 语 
音 转 文 字 功 能 的 App“Recordly” 也 希望 能 够 做 到 这 一 点 。 该 项 目 负责 


人 六 带 亚 ， 拉 杜 (Sintia Radu) 表示 : “Recordly 出 自我 们 自己 希望 
报道 和 写作 过 程 更 加 有 效 的 需求 。 我 们 把 听 录 音 看 成 浪费 时 间 ， 我 们 
认为 ， 以 这 个 烦人 的 工作 开始 写 任 何 报道 都 是 适得其反 ， 当 作者 听 完 
录音 以 后 ， 再 要 把 报道 完成 时 已 经 很 疲惫 了 。” 


2. 深度 学 习 能 够 增强 记者 的 分 析 能 力 


深度 学 习 能 够 更 深入 分 析出 受 访 者 或 事件 背后 的 深层 次 关系 。 在 
2017 年 1 月 的 总 统 就 职 演讲 过 程 中 ， 美 联 社 与 IBM 的 沃 森 认 知 技术 平台 
合作 ， 利 用 人 工 智 能 对 特 朗 普 的 面部 表情 进行 分 析 ， 同 时 结合 特 朗 普 
的 演讲 文本 、 演 讲 语调 、 人 格 洞悉 和 社交 媒体 趋势 等 数据 形成 一 些 基 
于 情感 分 析 赋 值 的 微 表 达 新 闻 报 道 。 沃 森 机 器 人 对 特 朗 普 关 键 情绪 触 
发 点 进行 了 打分 ， 给 出 的 情感 分 析 结 果 是 “悲伤 ” (0. 4996 ) 大 于 
“喜悦 ”0.4555) ， 且 情绪 表达 更 为 “偏激 ”， 这 一 点 与 后 来 《 今 
日 美国 》 发 布 的 新 闻 “ 分 析 : 特 明 普 短 小 、 黑 暗 且 有 挑 余 意 味 的 就 职 
演说 ”在 情感 色彩 表达 上 不 谋 而 合 。( 见 表 5. 4) 


表 5.4 IBM 沃 森 给 特 朗 普 就 职 演讲 各 类 情绪 所 打 的 分 数 


0.754812 


分 数 


0.075456 


0.231049 


0.068197 


0.455526 


0.499659 


资料 来 源 : 1BM Waston。 

目前 ， 还 有 一 类 “商业 关系 图 谱 ” 公 司 ， 利 用 深度 学 习 和 大 数据 
技术 ， 发 据 商 业 人 物 、 人 公司、 财产 等 之 间 的 关联 。 例 如 国内 的 “天 了 眼 
得 ”软件 通过 分 析 国 内 8 000 万 家 企业 、 人 、 实 体 之 间 关 系 的 投资 结 
构 ， 个 体 商 户 工 商 信息 以 及 企业 商标 信息 库 ， 公 开 的 诉讼 信息 等 海量 
数据 库 ， 用 深度 学 习 、 大 数据 技术 解析 出 商业 社会 天 系 网 络 ， 让 人 物 
关系 、 公 司 持 股 等 天 系 一 目 了 然 ， 目 前 已 经 被 记者 用 于 新 闻 报 道中 。 


3. 机 器 视 党 技术 有 助 于 查找 信息 和 数据 


机 器 视觉 技术 主要 用 于 从 照片 和 视频 中 目 动 提取 描述 数据 ， 例 如 
位 置 ， 可 识别 的 人 、 地 扣 和 事物 等 有 价值 的 元 数据 ， 使 图 像 更 容易 管 
理 或 被 搜索 、 及 现 ， 既 便于 编辑 快速 分 类 和 组 织 大 量 图 像 和 视频 的 语 
料 库 ， 提 高 编辑 速度 ， 又 为 调查 记者 提供 了 丰富 的 调查 证 据 。 

美 联 社 使 用 Digital Globe《〈 美 国 高 分 辨 率 地 球 影像 服务 供应 丙 ) 
的 卫星 图 像 技术， 来 锁定 东南 亚 海 域 轮船 的 高 分 辨识 图 像 ， 以 便 获 得 


一 个 关于 海洋 捕捞 行 业 滥 捕 的 调查 项 目的 重要 证 据 ， 该 报道 在 2016 年 
获得 普 利 策 奖 中 的 公共 服务 奖 。Digital Glope 的 计算 机 视觉 算法 能 够 
调整 其 卫星 摄像 涉 ， 拍 摄 最 佳 和 必要 的 图 像 ， 这 些 图 像 给 予 新 闻 工 作 
者 一 个 “上 上 帝 视 角 ”， 为 新 闻 报 告 提 供 了 一 个 全 新 的 参考 点 ， 这 超出 
了 传统 新 闻 报 道 团 队 的 能 力 范 围 。《〈 见 图 5. 20) 

在 另 一 个 工作 场景 中 ， 文 本 转 视频 平台 Wibbitz 利 用 图 像 识 别 ， 目 
动用 编辑 图 片 和 视频 脚本 生成 匹配 一 段 给 定 文 本 的 视频 ， 生 成 粗 前 的 
视频 供 编 辑 人 员 进 一 步 精 编 。 这 样 人 允许 记者 更 多 地 关注 内 容 ， 更 少 地 


关注 制作 视频 的 重复 工作 。 平 台 使 更 多 人 能 够 更 快 、 更 好 和 更 有 效 地 
工作 ， 也 能 帮助 制 片 人 大 规模 创作 有 了 吸引 力 的 视频 。2016 年 ， 阿 里 云 
还 演示 了 一 段 人 工 智能 解说 NBA《〈 美 国 职业 篮球 联赛 ) 的 视频 ， 这 项 技 
术 在 电视 、 网 络 媒体 的 即时 播报 中 也 将 发 挥 重要 作用 。 


约 83.4x13.3 米 类 似 的 攀 杆 
ye 


相连 接 


约 31.6 x8.7 米 


约 43.7x9.0 米 


图 5.20 东 南亚 商船 运送 货物 路 线 的 卫星 图 像 〈7 月 14 日 银 海 2 号 在 阿拉 弗 拉 海 ) 


图 片 来 源 : Digital Globe。 


传 感 费 新 闻 


2013 年 ， 纽 约 公共 广播 的 数据 新 闻 团 队 借助 土壤 光度 传感器 ， 准 
确 报道 了 美国 东海 岸 蝉 的 回迁 。 这 应 该 是 传感器 新 闻 的 最 初探 索 之 
一 。 随 着 智能 终端 呈现 指数 级 增长 《美国 计算 机 技术 工业 协会 预测 到 
2020 年 将 达到 500 亿 合 ) ， 未 来 社会 越 来 越 多 的 信息 将 直接 通过 这 些 终 
端的 传感器 获取 ， 呈 现 万 物 皆 媒 的 趋势 。 


传感器 必 将 改变 新 闻 的 采集 手段 。 在 这 个 层面 上 的 传感器 ， 是 人 
的 感官 延伸 ， 可 以 在 一 定 程度 上 帮助 人 突破 目 身 的 局 限 ， 从 更 多 罕 
间 、 更 多 维度 获得 与 解读 信息 。 通 过 传感器 获得 的 大 规模 环境 信息 、 
地 理 信 息 、 人 流 信 息 、 物 流 信息 、 上 自然界 信息 等 ， 可 以 为 专业 媒体 的 
报 庆 提供 更 为 丰富、 可 笔 的 数据 ， 甚 全 可 以 为 选 题 的 发 现 提供 线索 。 
传感器 对 某 些 特定 对 象 或 环境 的 监测 能 力 ， 也 使 它们 可 以 更 灵敏 地 感 
知 未 来 动 问 ， 为 预 训 性 报道 提供 依据 。 净 化 器 公司 了 解 每 个 家 庭 的 空 
气 状 况 ， 智 能 手表 、 知 能 手 环 公司 能 够 获取 一 个 地 区 民众 的 运动 和 喘 
体 状 况 。 未 来 ， 媒 体 可 能 需要 寻求 掌握 该 类 数据 的 合作 伙伴 ， 从 更 
深 、 更 广 的 层面 获取 新 闻 信息 ， 从 而 带 来 新 的 可 能 性 。 


美国 堪萨斯 城 一 家 创业 公司 ShotTracker 就 开发 了 一 套 智 能 系统 。 
这 套 系 统 通过 在 球鞋 和 篮球 中 植 入 传感器 ， 同 人 们 传达 球场 上 的 一 切 
言 息 ， 从 而 让 篮球 比赛 变 得 更 加 透明 。ShotTracker 系 统 还 能 根据 球员 
和 球 在 场 上 的 移动 数据 进行 实时 分 析 ， 包 括 球 员 投篮 次 数 、 失 误 次 
数 、 助 攻 、 抢 断 、 扣 篮 等 动作 ， 对 球员 情况 进行 一 系列 分 析 ， 把 在 本 
次 比赛 中 球员 的 优势 和 劣势 都 以 数据 的 形式 呈现 出 来 。 该 类 传感器 的 
普及 ， 将 使 体育 新 闻 报道 中 球员 表现 等 数据 的 准确 性 大 幅 提 升 。( 见 
图 5. 21) 


图 5.21 NBA 借 传感器 绘制 比赛 中 篮球 与 球员 的 运动 轨迹 


图 片 来 源 : cnbeta。 

另外 ， 传 感 器 还 有 “用 户 反 馈 ” 的 价值 。 作 为 反馈 机 制 的 传 感 
器 ， 将 用 户 反馈 深化 到 了 生理 层面 。 传 感 器 可 以 采集 用 户 的 心跳 、 脑 
电波 状态 、 眼 动 轨 迹 等 身体 数据 ， 准 确 测 量 用 户 对 于 某 些 信息 的 反应 
状态 。 这 样 一 个 层面 的 反馈 ， 不 仅 可 以 更 真实 、 精 确 地 反映 信息 在 每 
个 个 体 端的 传播 效果 ， 也 可 以 为 信息 生产 的 实时 调节 、 个 性 化 定制 或 
长 远 规划 提供 可 靠 的 依据 。 


在 智能 物体 作为 信息 采集 者 日 益 普 及 时 ，“ 物 一 人 ”之 间 的 直接 
信息 交互 也 将 逐渐 变 成 常态 。 由 “ 物 ” 所 监测 或 感知 的 某 些 信息 ， 也 
许 通 过 “ 物 一 人 ”信息 系统 ， 就 能 直接 到 达 目 标 受 众 ， 这 会 使 专业 媒 
体 的 中 介 性 意义 被 削弱 ， 甚 至 可 能 出 现 06C 〈0bject Generated 
Content， 物 体 生产 内 容 〉。 


个 性 化 新 闻 


个 性 化 新 闻 在 今天 已 被 普 遍 接受 ， 它 主要 体现 在 三 个 层面 : 一 是 
个 性 化 推送 ;， 二 是 对 话 式 呈现 ， 三 是 定制 化 生产 ， 这 是 个 性 化 新 闻 的 
更 局 目标 ， 它 的 成 亢 与 普及 取决 于 更 深层 的 用 户 洞 察 能 力 。 


1. 个 性 化 推送 


个 性 化 推送 凸显 了 算法 对 于 新 闻 分 发 的 意义 ， 算 法 的 水 平 决定 了 
个 性 化 匹配 的 精准 程度 。 一 个 人 长 期 使 用 茶 App 浏 览 新 闻 ， 该 用 户 的 阅 
读数 据 就 会 被 不 断 地 反馈 进 数 据 库 ， 用 户 国 像 就 逐渐 清晰 。 同 时 ， 随 
着 用 户 数量 的 增加 ， 通 过 相似 点 描绘 可 以 将 人 不 断 地 分 群 ， 从 而 进行 
群体 分 友 ， 再 加 上 之 前 累积 的 数据 ， 通 过 算法 运算 完成 智能 化 的 推 
存 。 但 令 大 家 担忧 的 是 ， 算 法 容易 被 其 所 有 公司 或 更 高 的 利益 集团 所 
控制 ， 失 去 新 闻 报道 的 独立 性 和 对 社会 进步 的 推动 作用 ， 这 一 点 已 经 
在 中 国 的 个 性 化 新 闻 中 有 所 体现 。 算 法 只 提供 受众 喜欢 阅读 或 认同 的 
信息 内 容 ， 导 致 个 人 消费 越 来 越 多 的 同类 信息 ， 以 致 个 体 受 众 不 太 可 
能 阅读 到 与 其 意见 相左 的 信息 或 观点 ， 社 会 上 不 同 声音 之 间 的 沟通 区 
流 日 趋 减少 ， 社 会 言论 也 越 来 越 单一 。 算 法 让 “过 滤 气 泡 ” 现 象 更 加 
严重 ， 给 社会 与 论 的 健康 融 来 风险 。 


2. 对 话 式 呈现 


一 些 媒 体 正在 探索 社交 机 器 人 在 新 闻 传播 中 的 应 用 ， 它 们 将 某 些 
新 闻 的 获取 和 阅读 过 程 变 成 一 个 互动 对 话 过 程 ， 通 过 机 器 人 与 用 户 的 
对 话 ， 来 了 解 用 户 的 阅读 偏好 ， 进 而 推荐 相关 的 内 容 ， 但 用 户 是 否 愿 
意 承 受 这 种 对 话 的 成 本 ， 仍 需 观 察 。 例 如 ， 全 球 数 生 万 的 用 户 可 以 要 
求 亚马逊 或 谷歌 的 智能 音箱 播放 美国 在 线 、《 华 盛 顿 邮 报 》 3 小 时 内 
的 精彩 新 闻 。 


3. 定制 化 生产 


和 今天 纯粹 用 算法 做 匹配 的 机 制 不 完全 一 样 ， 未 来 还 会 生成 所 谓 
定制 化 信息 的 生产 ， 即 基于 大 数据 分 析 的 、 基 于 场景 的 个 人 化 信息 定 
制 ， 针 对 用 户 的 兴趣 生产 和 讲解 。 定 制 化 生产 是 个 性 化 新 闻 的 更 高 目 
标 ， 它 的 成 熟 与 普及 取决 于 更 深层 的 用 户 洞 察 能 力 ， 场 景 分 析 是 理解 
用 户 在 特定 环境 下 需求 的 一 把 钥匙 。Automated Insights 已 经 在 该 方 
面 进行 尝试， 雅虎 正在 合作 关于 弥 想 运动 (fantasy sport) 的 内 容 ， 
用 户 可 以 选择 真实 比赛 中 登场 的 运动 员 ， 组 成 自己 的 球 队 ， 和 朋友 之 
间 相 互 比 赛 ， 在 美国 每 周 有 超 过 3 000 万 用 户 使 用 这 项 内 容 ， 为 每 一 对 
罗 配 的 对 抗 组 进行 报道 ， 用 户 能 够 知道 关注 的 队伍 表现 得 怎样 ， 投 球 
表现 如 何 ， 胜 利 了 还 是 失败 了 。 雅 虎 曾 经 的 做 法 是 发 布 一 个 报道 ， 让 
千 百 万 人 同时 读 它 ，Automated Insights 能 够 发 布 干 万 个 报道 ， 而 且 
每 个 报道 都 是 独一无二 、 专 门 为 用 户 定 制 的 。 


入 慧 城市 一 一 “上 和 帝 视 角 ” 的 城市 已 理 


早 在 2008 年 IBM 就 提出 了 智慧 城市 的 概念 ， 从 交通 、 医 疗 、 能 源 、 
政府 、 水 资源 、 安 全 、 楼 宇和 园区 领域 为 政府 提供 整套 的 智慧 城市 方 
案 。 目 的 是 让 城市 运转 更 加 高 效 环 保 ， 管 理 更 加 科学 ， 并 能 提前 发 现 
问题 ， 如 交通 拥堵 、 环 境 污染 、 公 共 安 全 等 。 随 后 ， 多 个 国家 开始 了 
智慧 城市 的 实践 ， 高 峰 时 期 ITBM 曾 有 超过 1 000 个 智慧 城市 项 目 在 建 。 
但 普通 市 民 似乎 并 未 感受 到 拥堵 的 交通 状况 有 所 改善 ， 地 震 、 火 灾后 
政府 的 响应 能 力 有 所 加 快 ， 就 医 的 体验 有 所 提升 。 

企业 、 政 府 、 未 来 学 家 都 希望 将 城市 打造 成 一 个 高 度 统一 的 智能 
系统 ， 但 庞大 的 软件 、 硬 件 、 基 础 设施 投入 和 短期 内 有 限 的 效益 形成 
了 较 大 反差 。 不 少 政府 放弃 了 IBM 起 初 的 方案 ， 转 而 从 垂直 领域 出 发 ， 


从 解决 具体 问题 入 手 ， 提 高 城市 的 智能 化 水 平 。 而 AI 在 其 中 扮演 了 越 
来 越 重 要 的 角色 ，AI 推 动 下 的 安防 、 交 通 系 统 、 政 务 服务 、 环 境 保护 
等 都 获得 了 质 的 突破 。 


交通 问题 是 让 很 多 大 城市 政府 头疼 的 问题 ， 即 使 有 明确 的 交通 规 
则 和 更 宽 的 马路 ， 墙 车 也 会 发 生 。 因 为 交通 系统 是 典型 的 “ 非 线 性 系 
统 ”， 有 非常 多 的 因素 相互 牵制 和 互相 依赖 。 在 大 城市 上 班 的 市 民 一 
定 会 感受 到 ， 早 高 峰 的 时 候 ， 你 6:00 出 门 ， 就 能 早 半 小 时 到 达 ， 而 你 
再 晚 10 分 钟 出 门 ， 可 能 就 会 迟到 。 


2016 年 ， 麻 省 理工 学 院 、 瑞 士 苏黎世 理工 学 院 和 意大利 国家 研究 
委员 会 联合 研究 团队 已 经 研发 出 一 球 新 道路 系统 ， 在 道路 上 将 不 再 有 
交通 信号 灯 ， 并 提出 了 “基于 时 段 的 交叉 路 口 ” 概 念 ， 其 与 航空 交通 
管制 系统 相似 ， 即 每 辆 汽车 接近 交叉 路 口 时 ， 由 交通 管理 系统 协调 交 
又 路 口 时 间 。 这 意味 着 整个 交通 系统 将 与 道路 上 的 所 有 汽车 实现 同 
步 。 抹 省 理工 学 院 可 感知 实验 室 研究 科学 家 、 意 大 利 国家 研究 委员 会 
会 员 保 罗 。 桑 带 (Paolo Santi) 表示 ， 将 交通 灯 更 换 成 基于 时 段 的 道 
路 系统 可 以 极 大 地 提高 交叉 路 口 的 交通 性 能 ， 而 且 交 通 堵塞 和 延误 现 
象 也 会 随 之 消失 。 而 韩国 最 大 的 通信 运营 商 SK 矿 商 正 在 测试 借助 56 实 
时 通信 技术 将 汽车 与 其 他 车 辆 和 行人 连接 起 来 的 技术 ， 最 终 使 未 来 的 
交通 不 再 需要 交通 信号 灯 。 其 计划 2019 年 开始 为 主要 高 速 公 路 推出 这 
种 自动 敬 驶 服务 ， 然 后 将 服务 扩展 到 更 繁忙 的 街道 。( 见 图 5. 22) 


图 5.22 不 再 有 交通 信号 灯 的 交叉 路 口 
图 片 来 源 : 麻 省 理工 学 院 可 感知 城市 实验 室 。 


未 来 ， 只 有 智能 驾驶 汽车 、 交 通 基础 设施 、 车 联网 、 交 通 管理 系 
统 整体 协同 才能 让 每 个 公司 的 无 人 车 在 公平 的 规则 下 行使 ， 才 能 实现 
真正 的 智能 交通 ， 从 而 大 幅 提升 交通 效率 。 阿 里 巴巴 为 城市 交通 系统 
打造 了 一 个 “城市 大 脑 ”。2016 年 10 月 ， 该 系统 首先 在 杭州 测试 ， 通 
过 杭州 5 万 多 个 道路 摄像 头 做 信息 采集 ， 相 关 数 据 汇集 到 后 台 进 行 交换 
与 处 理 ， 由 人 工 智能 系统 做 出 算法 决策 ， 然 后 再 传 回 交通 设施 上 执 
行 ， 可 以 对 整个 城市 进行 全 局 实时 分 析 ， 目 动 调配 公共 资源 ， 在 部 分 
路 段 的 测试 过 程 中 ，“ 城 市 大 脑 ” 让 车辆 的 通行 速度 最 高 提升 了 11%。 
该 类 系统 的 商用 也 将 大 幅 减 少 人 力 成 本 ， 阿 里 巴巴 视觉 计算 组 负责 
介绍 说 : “这 些 视 频 如 果 由 交警 三 班 倒 地 去 看 ， 需 要 15 万 个 交警 ， 而 
通过 算法 ， 城 市 大 脑 可 以 在 短 时 间 内 把 这 些 视频 都 看 完 ， 数 清楚 有 多 
少 辆 车 往 哪 个 方 回 走 了 。” 


高 级 辅助 驾驶 汽车 和 车 联网 结合 能 够 大 幅 降 低 城 市 的 交通 事故 ， 
并 减少 车 辆 的 能 源 消 耗 。 美 国 交 通 部 基于 600 万 例 交 通 事 故 的 分 析 数 据 
显示 ，ADAS (高 级 辅助 驾驶 系统 ) 的 使 用 能 够 降低 15% 的 交通 事故 ， 
V2X (车 联网 ) 的 使 用 能 够 降低 36% 的 交通 事故 ， 而 两 者 结合 能 够 避免 
96% 的 交通 事故 。 华 为 在 苏州 工业 园区 的 智慧 交通 测试 更 是 验证 了 这 
个 说 法 。 因 为 车 联网 的 引入 ， 交 通 延 误 能 够 降低 15%， 主 干道 平均 速度 
提高 15%， 停 车 次 数 降 低 17%。 而 欧洲 一 个 团队 通过 车 联网 让 车 辆 编队 
行驶 ， 能 够 减少 车 辆 油耗 7% 15%， 减 少 人 力 成 本 40%。 


安防 


AI 在 打击 恐怖 分 子 、 罪 犯 ， 预测 突 发 情况 ， 管 理 密集 人 群 等 方面 
开始 发 挥 较 大 效用 。 图 像 识 别 技 术 开 始 让 城市 管理 系统 实现 目标 检测 
(车 牌 识别 ) 、 人 脸 识 别 〈 属 性 提取 ) 、 目 标 分 类 《〈 车 、 行 人 ) 等 功 
能 。 主 要 用 在 运动 目标 检测 、 周 边 入 侵 防 范 、 目 标识 别 、 车 辆 检测 、 
人 流 统计 等 方面 。 

图 像 和 视频 识别 可 以 分 为 下 列 几 大 类 应 用 。 

(1) 人 脸 识 别 及 统计 (包括 导语 识别 〉。 

(2) 虹膜 / 指纹 识别 。 

(3) 表情 识别 - 测 谎 仪 。 

(4) 物体 识别 及 动作 顺序 。 

(5) 网络 特定 类 图 片 监控 。 

(6) 第 四 类 步 态 识别 。 

第 一 类 图 像 识 别 是 人 脸 识别 。 全 世界 人 脸 识 别 最 大 的 市 场 是 中 
国 ， 人 脸 识 别 在 中 国 已 经 被 广泛 应 用 于 手机 支付 、ATM 机 、 门 禁 、 打 
卡 、 海 关 、 车 (机 ) 票 、 交 通 违规 监测 、 安 全 监控 等 。 人 脸 识别 甚至 


开始 应 用 于 快餐 店 ， 利 用 老 客户 的 点 餐 习 惯 加 快 点 餐 速 度 。 人 脸 识 别 
还 可 以 用 于 寻找 早年 被 拐卖 的 儿童 。 中 国 各 地 目前 有 大 约 1. 8 亿 个 摄像 
头 ， 到 2020 年 将 增加 到 4. 5 亿 个 ， 平 均 每 三 个 人 一 个 摄像 头 。 中 国 已 经 
建成 了 世界 上 最 大 的 视频 监控 网 “中 国 天 网 ”， 利 用 人 工 智 能 和 大 数 
据 进 行 警 务 预测 。2017 年 4 月 ， 深 圳 已 经 开始 利用 人 脸 识别 技术 来 识别 
乱 穿 马路 的 行人 。2016 年 ， 中 国安 防 行业 市 场 规模 已 经 达到 5 400 亿 
元 ， 同 比 增长 9%%。 预 计 未 来 几 年 ， 中 国安 防 行业 市 场 规 模 将 从 2015 年 
的 近 5 000 亿 元 增长 到 2020 年 的 8 759 亿 元 ， 年 增长 率 在 11% 以 上 。 


人 脸 识 别 的 主要 任务 有 两 类 : 一 类 是 在 一 组 未 知 的 图 像 中 找 出 是 
否 有 某 个 人 ; 男 一 类 是 判断 一 张 图像 是 否 为 某 个 特定 的 人 。 传 统 的 目 
动 图 像 识别 分 为 以 下 几 步 。 

(1) 先 用 一 组 事先 定义 的 人 上 脸 特 征 把 将 要 识别 的 人 脸 进行 分 类 ， 
每 个 人 脸 都 表现 为 特征 集中 的 一 组 参数 。 


(2) 在 图 像 中 首先 识别 有 没有 人 脸 ， 如 果 有 ， 再 识别 在 图 像 中 的 
什么 位 置 。 

(3) 提取 图 像 中 每 个 人 脸 的 特征 ， 将 这 些 特征 和 已 经 存在 于 数据 
库 的 各 个 人 脸 特 征 参数 进行 比较 ， 找 到 相似 度 最 高 的 人 上 脸 。 


而 深度 学 习 放 弃 了 使 用 事先 定义 好 的 人 脸 特 征集 ， 而 是 用 已 知人 
脸 图 像 去 训练 模型 。 目 前 ， 在 图 像 识别 中 主要 使 用 CNN， 不论 是 什么 样 
的 应 用 ， 都 是 先 有 一 组 已 经 标注 的 训练 图 像 ， 用 这 组 训练 图 像 将 CNN 训 
练 好 以 后 ， 用 CNN 来 识别 未 知 的 图 像 。 比 较 简 单 的 应 用 是 个 人 网 像 认 
证 ， 例 如 手机 刷 脸 密码 。 这 种 应 用 的 图 像 清晰 (基本 都 是 对 着 镜头 的 
大 头 照 ) ， 而 且 只 需要 识别 是 否 为 某 一 个 人 ， 训 练 集 只 是 一 个 人 的 不 
同 照 片 。 第 二 类 是 门禁 、 打 卡 、 车 票 等 系统 类 ， 需 要 识别 出 摄像 头 前 
是 存在 数据 库 里 的 一 群 人 中 的 哪 一 位 。 这 两 类 应 用 都 是 被 识别 人 “和 希 
望 被 认 出 来 ”， 所 以 问题 相对 简单 。 比 较 困 难 的 是 “不 希望 被 认 出 
来 ”的 情形 ， 例 如 ， 在 公共 场合 的 摄像 头 里 监控 是 否 有 某 一 群 人 中 的 
一 个 或 几 个 出 现 。 挑 战 在 于 摄像 头 的 分 辨 率 有 限 ， 被 摄影 人 离 镜头 的 


距离 太 远 ， 光 线 和 朝向 、 姿 势 都 有 许多 变化 ， 更 别提 如 果 化 妆 或 者 整 
形 的 情况 了 。 假 设 摄像 头 的 分 辨认 为 1 920X1 080〔 高 清 电视 )， 可 
靠 地 识别 一 个 人 脸 需 要 分 辨 紊 不 低 于 100X100。 根 据 不 同 的 景深 和 男 
幅 ， 当 人 脸 和 摄像 头 距 离 10 20 米 时 ， 人 脸 识别 的 可 靠 性 就 会 大 幅 下 
降 。 另 外 摄像 头 的 安装 位 置 都 远 远 局 于 人 脸 ， 当 人 离 摄像 头 太 近 时 ， 
头顶 会 误 挡 人 腔 。 总 体 来 说 在 一 个 公共 场合 ， 例 如 丙 场 或 广场 角落 的 
摄像 涉 想 要 准确 识别 人 流 中 是 否 有 记录 在 案 的 人 是 一 件 非 常 有 挑战 性 
的 事 。 指 纹 识别 和 虹膜 识别 的 原理 都 和 人 脸 识 别 类 似 ， 但 细节 不 同 。 


目前 公共 场合 图 像 和 视频 监控 的 一 个 技术 发 展 方向 是 把 识别 能 
和 摄像 头 放 在 一 起 。 设 想 一 个 大 城市 有 上 百 万 个 摄像 头 ， 如 果 每 个 摄 
像 头 按照 每 秒 64k 比 特 速率 向 云端 传送 ， 每 天 就 会 产生 上 千 ]B 的 数据 ， 
无 论 是 处 理 还 是 储存 成 本 都 非常 高 。 更 重要 的 是 从 监控 特定 人 群 的 角 
度 来 看 ， 这 些 数据 绝 大 部 分 都 是 无 用 数据 。 如 果 识 别 能 力 放 在 摄像 头 
端 ， 那 么 只 有 当 发 现 疑 似 目标 时 才 会 上 传 数据 。 这 种 摄像 头 端的 识别 
可 以 用 高 速 CPU 和 GPU 来 做 ， 但 价格 太 高 。 假 设 一 个 监控 点 的 整个 成 本 
为 1 万 元 人 民 币 〈 包 括 摄像 头 、 拉 电源 、 拉 网 线 、 安 装 费 用 ) ， 识 别 芯 
片 的 成 本 不 应 该 超过 2 000 元 人 民 币 。 而 且 耗 电 不 能 太 高 ， 因 为 户外 环 
境 不 容易 安装 散热 设备 。 目 前 的 解决 方案 主要 是 FPGA (现场 可 编程 站 
阵列 ) ， 但 当 算法 稳定 和 标准 形成 后 ， 长 远 解 决 方案 一 定 是 低 功 耗 、 
低 成 本 的 专用 芯片 。 设 计生 产 这 种 芯片 的 可 以 是 芯片 设计 厂商 ， 但 更 
有 优势 的 是 那些 已 经 大 量 生产 和 部 署 摄像 头 的 公司 。 

人 脸 识 别 中 还 包括 表情 识别 和 导语 识别 。 用 表情 识别 来 测 谎 可 能 
比 心电图 更 准确 。 由 于 表情 的 定义 本 身 比较 模糊 ， 分 类 也 很 有 挑战 
所 以 很 难 另外 取得 被 测 者 的 标注 数据 。 层 语 识别 是 一 项 集 机 器 视觉 与 
自然 语言 处 理 于 一 体 的 技术 ， 即 通过 人 的 口 型 变化 推测 说 了 什么 话 。 
早 在 2003 年 ， 英 特 尔 便 开发 了 “视听 说 识别 系统 ”软件 ， 供 开发 者 研 
制 能 读 懂 “ 层 语 ”的 计算 机 。2016 年 ， 谷 歌 DeepMind 英 文 唇 语 识别 系 
统 便 已 经 可 以 支持 17500 个 词 了 ， 新 闻 测试 集 识 别 准确 率 达 50% 以 上 。 
目前 口 型 识别 的 准确 率 能 够 达到 约 60%。2017 年 12 月 ， 搜 狗 推 出 了 中 文 


版 的 唇 语 识 别 ， 可 以 直接 从 有 人 讲话 的 视频 中 ， 通 过 识别 说 话 人 的 唇 
部 动作 ， 来 解读 说 话 者 所 说 的 内 容 。 通 过 端 到 端 深 度 神经 网 络 技 术 进 
行 中 文 唇 语 序列 建 模 ， 经 过 数 干 小 时 的 真实 导语 数据 训练 ， 打 造 了 一 
个 “ 层 语 模型 ”， 在 非特 定 人 开放 口语 测试 集 上 ， 该 系统 达到 60% 以 
上 上 的 准确 率 ， 在 垂直 场景 命令 集 例 如 车 载 、 智 能 家 居 等 场景 下 甚至 已 
经 达到 90% 的 准确 率 。〔 见 图 5. 23 ) 


第 二 类 图 像 识 别 是 物体 识别 和 统计 。 例 如 在 卫星 照片 中 识别 地 面 
有 和 多少 架 飞 机 、 分 别 是 什么 型 号 ， 地 铁 站 每 天 有 多 少 乘客 ， 商 场 有 多 
少 特 定 类 型 的 顾客 (例如 年 轻 女 性 ) 等 。 有 挑战 的 是 在 视频 中 识别 一 
个 物体 的 茶 个 部 位 的 连续 动作 ， 例 如 识别 一 个 挖掘 机 铲 斗 在 一 个 时 间 
段 里 挖掘 了 多 少 斗 矿石 。 
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图 5.23 唇 滞 识 别 技术 原理 
图 片 来 源 : 搜狗 。 


第 三 类 图 像 识别 是 识别 出 网 络 中 上 传 的 图 像 或 视频 是 否 违规 ， 例 
如 黄色 图 片 。 这 种 应 用 也 相当 有 挑战 性 ， 原 因 之 一 是 被 识别 类 别 不 容 
易 清晰 界定 “比如 到 底 什 么 算 黄色 ) ， 原因 之 二 是 训练 集 可 能 会 非常 
大 ， 使 训练 和 识别 的 成 本 都 非常 高 。 


第 四 类 图 像 识别 是 步 态 识别 ， 中 国 科学 院 研究 出 了 一 种 新 兴 的 生 
物 特征 识别 技术 一 一 步 态 识别 。 该 技术 只 看 走路 的 姿态 ， 在 50 米 内 ， 
甩 两 下 眼睛 的 时 间 ， 摄 像 头 就 能 准确 辨识 出 特定 对 象 ， 即 使 遮挡 了 面 
部 也 有 效 。 虹 膜 识 别 通 常 需要 目标 在 30 厘 米 以 内 ， 人 脸 识 别 需 在 5 米 以 
内 ， 而 步 态 识别 在 超 高 清 摄 像 头 下 ， 识 别 距 离 可 达 50 米 ， 识 别 速 度 在 
200 晕 秒 以 内 。 此 外 ， 步 态 识 别 无 须 识 别 对 象 主动 配合 ， 即 便 一 个 人 在 
几 十 米 外 戴 着 面具 背 对 普通 监控 摄像 头 随意 走动 ， 步 态 识 别 算 法 也 可 
以 对 其 进行 身份 判断 。 步 态 识别 还 能 完成 超大 范围 人 群 密度 测算 ， 能 
够 对 100 米 外 或 者 1 000 平 方 米内 的 上 千 人 进行 实时 计数 。 这 些 技术 能 
广泛 应 用 于 安防 、 公 共 交 通 、 商 业 等 场景 。 


预测 管理 


2014 年 12 月 31 日 晚间 发 生 在 上 海外 滩 的 踩踏 事件 ， 造 成 36 人 死 
亡 ，49 人 受伤 。 其 原因 就 是 跨 年 夜 活动 引发 了 相当 多 的 游客 光临 ， 而 
城市 管理 者 不 清楚 人 流 密度 ， 从 而 没有 及 时 玻 散 ， 该 类 问题 随 着 AI 的 
到 来 将 逐步 得 到 解决 。AI 结 合 大 数据 技术 ， 已 经 能 够 在 城市 的 人 流 预 
测 、 天 气 预测 、 灾 害 预测 等 方面 发 挥 作用 。 微 软 亚洲 研究 院 借助 CNN、 
RNN 技 术 与 城市 的 数据 ， 己 经 能 够 成 功 预测 未 来 十 几 个 小 时 的 城市 人 流 
情况 、 雾 者 发 生 概 率 等 ， 这 将 在 一 定 程 度 上 改写 城市 的 管理 方式 。 

微软 亚洲 研究 院 以 贵阳 出 租车 的 实时 数据 为 样本 ， 基 于 人 工 智 
能 、 云 计算 、 大 数据 做 了 实时 的 人 流量 预测 系统 。 系 统 把 城市 划 成 1 
000 米 x 1 000 米 的 格子 ， 预 测 每 个 格子 里 面 未 来 会 有 多 少 出 租车 进 
出 。 每 个 格子 颜色 不 同 ， 代 表 了 不 同 的 信息 ， 每 点 一 个 格子 就 会 跳出 


一 个 图 形 和 表格 ， 能 清楚 知道 整个 城市 某 个 区 域 人 群 流动 接 下 来 十 几 
个 小 时 会 呈现 什么 状态 。 比 如 已 经 发 生 过 的 出 租车 进出 情况 ， 未 来 的 
人 流 情 况 ， 昨 天 同一 时 间 的 情况 等 。 同 样 地 ， 任 何人 流 预 测 数据 来 
源 ， 比 如 手机 信和 号、 地铁 刷卡 记录 等 ， 都 可 以 通过 该 系统 模型 进行 运 
算 从 而 得 到 某 地 将 有 多 少 人 进出 的 结果 ， 并 预测 未 来 十 几 个 小 时 的 城 
市 人 流 情 况 。 微 软 亚 洲 研 究 院 的 郑 宇 博士 领导 了 这 个 研究 ， 该 研究 成 
果 《 城 市 人 群 流 动 的 深度 时 空 预 测 网 络 》 〈 Deep Spatio-7Tempora] 
Residual Networks for Citywide Crowd Flows Prediction) 已 经 发 
表 在 第 31 届 人 工 智 能 大 会 AAAI-17 上 。 〈( 见 图 5. 24) 


苞 细 
忆 直 加 草 区 二 痢 和 向 攻 轩 下 有 
hs | «hs | RL 
We 
:- _ | | | 此 | 是 天 ”1 有 
Ce FY 


广 

时 

| 

| 1 午 
_ 十 
小 = 加 
图 

一 
iE 


而 袖 图 
Eo 


1 


图 5.24 贵 阳 实 时 人 流量 预测 系统 
图 片 来 源 : 微软 亚洲 研究 院 。 
未 来 这 个 方向 的 研究 还 会 有 更 深远 的 发 展 ， 该 研究 已 经 可 以 用 来 
预测 城市 雾 考 等 空气 质量 情况 。 未 来 应 该 还 可 以 预测 几 天 内 有 无 大 暴 
雨 ， 基 于 城市 基础 设施 ， 预 测 哪些 地 方 会 被 潭 ， 哪 些 地 方 排水 不 够 


有 
等 。 


重复 体力 苑 动 者 将 被 机 项 人 全 面 奉 代 


机 器 人 中 最 大 的 一 支 就 是 自动 驾驶 汽车 ， 因 为 这 个 产业 太 大 ， 通 
常 大 家 把 它 专门 拿 出 来 研究 。 不 算 自 动 驾 驶 汽车 和 无 人 机 的 机 器 人 市 
场 到 底 有 多 大 ? IDC 研 究 报告 预计 ， 到 2019 年 全 球 机 器 人 市 场 规模 将 达 
到 1 350 亿 美元 ，2015 年 全 球 机 器 人 支出 为 710 亿 美元 ， 并 将 以 17% 的 年 
复合 增长 率 增长 。 


这 个 市 场 主要 包括 三 个 类 型 : 装配 线 机 器 人 、《 与 人 ) 合作 型 机 
器 人 、 目 主 型 机 器 人 。 闭 配 线 机 器 人 的 特点 是 动作 程式 化 ， 并 且 不 需 
要 判断 。 根 据 工 业 装 配 线 的 事先 设计 要 求 给 机 器 人 输入 指令 后 ， 机 顺 
人 一 直 做 重复 性 的 动作 。 合 作 型 机 器 人 主要 是 和 人 一 起 完成 生产 线 上 
的 任务 ， 由 人 来 做 复杂 和 需要 判断 的 事情 ， 由 机 器 做 蔷 百 但 重复 性 强 
的 工作 。 合 作 型 机 器 人 和 装配 线 机 器 人 人 类似， 但 是 因为 和 人 近 距 离 在 
一 起 操作 ， 所 以 需要 有 紧急 保护 装置 ， 以 防 伤 人 。 人 工 乔 能 影响 最 大 
的 是 自主 型 机 器 人 ， 这 类 机 器 人 目前 主要 是 做 服务 型 工作 ， 例 如 商场 
导购 、 酒 店 门厅 接待 、 医 院 送 器 械 和 药 、 小 区 巡逻 、 家 寿 卫 生 、 食 品 
制作 等 。 目 前 最 成 熟 的 是 扫地 机 器 人 ， 每 年 能 卖 出 上 千 万 台 ， 其 他 的 
都 还 不 成 熟 。 原 因 之 一 在 于 每 一 个 服务 项 目的 感知 、 判 断 和 行动 决策 
都 很 复杂 ， 与 自动 获 驶 类 似 ， 如 果 成 本 太 高 ， 束 没有 经 济 价 值 。 服 务 
型 机 器 人 的 第 二 个 问题 是 如 何 和 现 有 流程 配合 。 例 如 小 区 巡逻 ， 如 果 
机 器 人 无 法 一 次 取代 保安 的 所 有 复杂 工作 ， 那 么 机 器 人 如 何 和 小 区 保 
安 分 工 协调 ? 故障 和 维修 如 何 解 决 ? 目 主 型 机 器 人 未 来 的 主要 市 场 仍 
然 是 工业 生产 线 。 目 前 高 产值 重型 装配 ， 例 如 汽车 ， 已 经 越 来 越 多 地 
使 用 机 器 人 ， 但 许多 低产 值 的 轻型 装配 还 需要 使 用 大 量 人 工 。 随 着 机 
俐 人 成 本 的 降低 ， 这 类 生产 线 也 将 逐渐 配备 机 器 人 。 故 一 类 是 非 浪 配 
型 的 生产 线 ， 例 如 食品 加 工 、 禽 畜 屠 罕 、 货 物 分 拣 等 。 这 些 工作 在 理 
论 上 都 能 逐渐 和 伞 机 器 人 取代 ， 前 提 是 一 人 台 机 顺 人 的 成 本 低 于 一 个 生产 
工人 的 1 2 年 的 工资 福利 。 在 技术 上 要 求 这 类 机 器 人 有 一 定 的 视觉 感 


知 ， 较 快 的 处 理 速 度 。 最 重要 的 是 机 器 人 大 脑 软 件 必 须 适应 性 极 强 ， 
能 够 在 现场 设置 匹配 各 种 不 同 的 生产 过 程 或 者 能 够 学 习 新 技能 ， 而 不 
必 为 每 个 生产 流程 专门 制作 软件 。 这 要 求 开 发 出 一 亚 通 用 机 器 人 大 脑 
软件 ， 包 括 通 用 的 感知 、 判 断 和 控制 ， 并 且 能 够 方便 地 设置 成 不 同 的 
应 用 场景 。 可 以 预见 ， 能 开发 出 这 种 软件 的 公司 将 有 巨大 的 商业 前 
景 。 与 此 同时 ， 一 个 能 够 装 在 大 批 中 低 端 自主 型 机 器 人 上 的 将 感知 、 
控制 、 通 信 都 集成 到 一 起 的 低 成 本 心 片 也 会 很 有 商业 前 景 。 


打通 巴 别 塔 一 一 黑 天 物 杀 手 级 应 用 


当 所 有 人 对 AI 的 注意 力 都 集中 在 诸如 自动 驾驶 、 人 脸 识 别 等 “ 低 
垂 果 实 ” 上 时 ， 一 场 最 深刻 的 革命 很 可 能 发 生 在 自然 语言 翻译 和 理解 
领域 。 这 场 革命 可 能 改变 自 几 十 万 年 前 智 人 发 出 第 一 声 有 意义 的 “ 哼 
哼 ”以 来 的 人 类 文明 史 。 人 类 有 可 能 第 一 次 无 障碍 地 协同 盖 起 一 座 
“ 巴 别 塔 ”。 一 旦 语言 的 隔离 被 打破 ， 文 化 的 隔 闵 也 将 在 几 代 人 之 闻 
被 冲破 。 


图 5.25 巴 别 塔 
图 片 来 源 : http://nolabelsnolies. com/different-tower-of-babe1/。 


笔者 2015 年 在 巴西 自驾 旅行 时 须 奥 不 可 离 的 就 是 手机 里 的 谷歌 翻 


译 应 用 。 巴 西 能 讲 英 语 的 人 不 多 ， 不 论 是 租车 还 是 住 店 ， 笔 者 都 要 掏 
出 手机 给 谷歌 翻译 说 一 通 英语 让 手机 翻译 成 葡萄 牙 语 ， 然 后 拿 着 手机 
给 对 方 播放 ， 再 让 对 方 对 独 手 机 说 一 通 簿 人 荀 牙 语 ， 翻 译 后 对 着 目 己 播 
放 。 由 于 翻译 得 不 准确 ， 加 上 现场 的 噪声 ， 来 回 让 双方 对 着 手机 麦克 
风 等 ， 使 用 体验 非 钊 痊 ， 但 比 疫 有 要 强 很 多 。 这 里 面 有 很 多 技术 问题 
再 要 解决 ， 能 够 使 翻译 体验 流畅 的 最 低 要 求 有 以 下 几 点 。 


(1) 不 需要 拿 着 手机 来 回 对 着 双方 。 理 想 化 的 器 件 是 一 个 挂 在 及 
子 上 的 小 项 链 ， 或 者 是 一 个 远 小 于 手机 的 可 以 放 在 对 话 双方 之 间 的 小 
例子， 里面 有 像 亚马逊 智能 音箱 Echo 那样 的 扬声器 和 多 声 道 麦 克 风 可 
以 聚焦 讲话 者 的 声音 ， 滤 除 现场 噪音 。 

(2) 不 需要 每 说 一 句 话 都 要 按 一 次 “翻译 ”或 “播放 ”。 翻 译 机 
和 活 人 翻译 一 样 ， 只 要 检测 到 说 话 者 的 停顿 或 一 段 完整 意思 的 结束 ， 
马上 就 开始 播放 翻译 。 


(3) 必须 能 够 离线 。 当 手机 没有 联网 信号 时 ， 手 机 里 的 存储 内 容 
和 计算 能 力 足够 一 些 常用 的 翻译 。 

(4) 翻译 准确 率 达到 99%。 自 从 2017 年 初 谷歌 将 翻译 后 台 从 传统 
的 统计 方法 改 为 神经 网 络 翻译 后 ， 准 确 率 大 大 提高 。 随 着 翻译 量 的 增 
多 ， 相 信 以 目 前 的 神经 网 络 和 计算 能 力 ， 已 足够 应 对 日 常生 活 〈 例 如 
旅行 ) 的 翻译 。 但 是 要 进行 专业 或 和 历史 文化 深刻 联系 的 翻译 ， 还 需 
要 一 定 的 努力 。 

以 上 只 是 对 一 个 翻译 机 最 低 的 要 求 ， 进 一 步 的 要 求 是 这 个 翻译 机 
在 生活 中 “ 隐 去 ”， 成 为 日 常 穿戴 的 一 部 分 。 例 如 做 成 极 小 的 像 助 听 
器 那样 的 器 件 ， 通 过 手机 和 网 络 相连 ， 可 以 做 到 无 颖 的 “ 同 声 传 
译 ”， 并 在 同 声 传译 时 可 以 抵消 对 方 发 出 的 原声 ， 即 “原声 抵消 ”， 
做 到 听 者 只 能 听 到 翻译 而 不 被 原声 干扰 。 

要 做 到 以 上 无 锋 、 流 畅 的 翻译 ， 基 础 的 技术 都 已 经 成 熟 或 接近 成 
热 。 主 要 的 技术 难点 有 以 下 几 个 。 

(1) 微型 多 声 道 抗 噪 远 场 声音 检测 技术 。 

(2) 目前 亚马逊 的 Echo 已 经 具备 了 多 声 道 抗 噪音 和 说 话 者 方向 聚 
焦 功能 ， 但 这 些 功能 还 需要 进一步 改进 。 包 括 能 够 识别 不 同 的 人 ， 不 
必 每 次 喊 “Alexa”《〈 亚 马 壕 语音 助理 ) ， 能 在 更 哮 杂 的 环境 下 识别 语 
音 ， 最 重要 的 是 进一步 微型 化 。 

(3) 语义 理解 。 神 经 网 络 在 短 短 的 几 年 内 大 大 提高 了 语音 识别 的 
准确 率 ， 但 是 语义 理解 仍然 是 瓶颈 。 对 着 机 器 翻译 说 一 大 段 话 ， 机 器 
翻译 会 暴 的 。 

(4) 学习“ 主人 ”的 背景 和 个 性 ， 以 便 更 透彻 地 理解 每 一 句 话 。 

机 器 翻译 的 进一步 发 展 是 在 文化 背景 方面 远 超人 类 。 例 如 一 个 英 
文 翻译 如 果 不 是 在 美国 长 大 ， 即 使 阅读 量 很 大 ， 也 有 文化 背景 的 阿 
阅 。 例 如 当 大 家 谈论 起 几 十 年 前 的 一 个 电影 镜头 ， 或 菜场 棒球 比赛 的 
一 个 击 打 ， 或 者 一 个 南部 地 区 的 生 个 但 语 时 ， 翻 译 就 不 懂 了 。 一 个 没 


在 中 国生 活 过 的 汉语 翻译 也 存在 同样 的 问题 。 而 像 海 绢 一 样 大 量 吸收 
背景 知识 恰恰 是 机 器 学 习 的 强项 。 可 以 预见 未 来 的 机 器 翻译 就 像 一 个 
同时 在 两 个 国家 长 大 的 孩子 一 样 熟悉 双方 的 历史 和 文化 。 

机 器 翻译 未 来 还 会 增加 一 项 人 类 做 不 到 的 功能 ， 束 十 提前 熟悉 对 
方 的 背景 。 当 人 类 进行 一 次 重要 会 见 或 谈判 时 ， 都 会 事先 做 功 读 了 解 
对 方 。 人 类 花 几 天 做 的 事 ， 机 器 可 以 一 秒 做 完 。 

根据 目前 人 工 智能 芯片 和 算法 的 发 展 ， 随 身 翻译 可 以 在 5 “10 年 内 
实现 ， 能 超越 人 的 翻译 可 以 在 20 年 左右 实现 。 

一 旦 无 纤 、 流 畅 的 同 声 翻译 实现 了 ， 对 世界 的 影响 就 是 巨大 的 。 
目前 虽然 交通 和 通信 将 物理 距离 缩短 ， 增 加 了 人 类 的 交流 和 分 工 合 
作 ， 但 是 语言 隔 头 仍然 是 最 主要 的 障碍 。 中 国 目 前 有 上 亿 人 出 国旅 
游 ， 大 部 分 是 跟 团 游 ， 如 果 有 了 无 颖 、 流 畅 的 翻译 ， 到 外 国 和 到 中 国 
一 个 省 的 感 沉 一样， 那么 很 多 人 会 选择 自助 游 。 商 业 的 交流 成 本 也 会 
大 幅 降低 ， 到 任何 其 他 国家 工作 都 没有 语言 障碍 。 这 种 无 终 、 流 畅 的 
同 声 翻译 冲击 最 大 的 是 文化 和 里 份 认同 。 今 天 世界 民族 主义 回 渭 ， 民 
族 国 家 的 界限 主要 以 语言 和 文化 进行 划分 ， 当 这 层 墙 被 拆 掉 后 ， 今 天 
的 民族 国家 是 否 还 会 存在 ? 2017 年 10 月 Google 发 布 了 一 球 与 智能 手机 
配套 的 智能 耳机 ， 在 谷歌 语 首 拉 术 、 翻 译 技术 的 支持 下 ， 这 球 小 小 的 
耳机 可 以 实现 40 种 语言 实时 翻译 功能 ， 虽 然 不 是 非常 准确 ， 但 是 基本 
的 旅游 度假 还 是 可 以 保证 的 。《〈 见 图 5. 26 ) 


证 | 


图 5.26 谷 歌 的 实时 镭 


无 颖 、 演 畅 的 同 声 翻译 最 终 会 叶 致 全 球 文化 多 样 性 的 消失 吗 ? 不 
会 。 原 因 是 每 个 人 讲 的 和 听 的 仍然 是 目 己 的 母语 。 人 类 将 生活 在 一 种 
“ 双 层 社会 ”中 : 一 层 是 “世界 大 同 层 ”， 大 家 各 自 说 着 日 己 的 母 
语 ， 但 是 规则 和 习惯 逐渐 融合 ; 为 一 层 是 “本 土家 乡 层 ”， 各 目的 习 
俗 仍然 不 同 。 只 要 没有 超级 规模 的 人 类 大 迁徙 和 混合 ， 各 种 母语 文化 
仍然 会 继续 生长 。 这 并 不 奇怪 ， 其 实 今天 人 类 在 世界 范围 内 的 商业 活 
动 已 经 是 使 用 和 遵循 共同 的 规则 了 。 


译 耳 机 


全 方位 冲击 


AI 对 各 个 产业 的 影响 只 是 开端 。 任 何 一 个 行业 只 要 在 运行 过 程 中 
产生 大 量 数据 ， 就 可 能 被 AI 优化 和 部 分 《或 者 全 部 ) 上 自动化。 如 有 果 这 


个 行业 资金 多 ， 那 么 更 会 吸引 一 系列 新 创 公 司 进入 这 个 行业 来 颠 禾 。 
除了 我 们 在 前 面 讨 论 的 交通 运输 、 医 疗 健康 、 金 融 服 务 等 行业 之 外 ， 
下 列 行业 也 将 不 可 避免 地 受到 AI 的 冲击 。 


制造 业 


除了 生产 线 、 装 配 线 继 续 大 量 使 用 机 器 人 以 外 ， 制 造 业 的 供应 链 
管理 、 营 销 也 将 大 量 采用 AT。 阿 里 巴巴 的 “BT 工业 大 脑 ” 帮 助 协 每 光 
伏 的 民品 率 提 升 1% ， 一 年 节省 上 亿 元 成 本 对 整个 中 国 制 造 业 而 言 意 味 
着 巨大 的 利润 增长 空间 。 


批 肥 零售 业 


目前 批发 零售 业已 经 受到 互联 网 的 严重 冲击 ， 互 联网 公司 由 于 从 
诞生 之 日 起 束 拥 有 数据 且 会 利用 数据 ， 将 率先 采用 AI 继续 颠 履 零售 
业 。AI 正 在 积极 影响 零售 业 的 运输 、 定 价 与 促销 、 供 应 商 互 动 和 管理 
决策 等 环节 。 据 麦肯锡 测算 ， 基 于 AI 的 需求 预测 方法 比 传统 方法 的 预 
测 误差 减少 30% 70%， 由 于 产品 无 效 性 导致 的 销售 损失 可 以 降低 65%。 
今天 亚马逊 和 阿里 巴巴 的 无 人 零售 店 只 是 端倪 ， 自 动 驾驶 送 货 上 门 和 
裔 地 开花 的 自动 售 货 店 有 可 能 彻底 取代 传统 零售 业 。 


法 律 


IBM、 阿 里 巴巴 、 科 大 讯 飞 在 法 条 的 查找 、 审 判 记 录 等 方面 开始 使 
用 AI。IBM 的 沃 森 系 统 可 以 帮助 找到 “判例 法 ”， 帮 助 律师 找到 更 有 力 
的 证 据 。 知 识 产 权 律 师 可 以 用 AI 目 动 得 找 过 往 的 专利 ， 搜 索 专 利 违 反 
和 版 权 虽 禄 事件 ， 甚 至 能 起 草 专 利 申请 。 


广告 营销 

Facebook 通 过 AI 技术 扫描 用 户 的 状态 更 新 、 上 传 的 图 片 、 视 频 ， 
签到 ， 点 赞 ， 其 至 是 Linked Apps〔 连 接应 用 〉 等 相关 数据 ， 能 够 生成 
用 户 的 数字 档案 和 用 户 画 像 ， 从 而 实现 智能 投放 和 精准 的 营销 服务 。 
视频 广告 领域 Vediot+ (智能 广告 位 识别 投放 与 营销 解决 方案 公司 ) 利 
用 AI 为 客户 在 网 络 剧 、 节 目 直 播 中 寻求 到 精准 的 广告 投放 。 


房地产 


无 人 机 监理 、 机 器 人 巡逻 、 建 筑 、 工 程 监理 、 房 屋 销 售 和 租赁 、 
物业 管理 等 一 系列 环节 将 被 AI 优化 或 取代 。 


政府 和 公用 事业 


政府 的 运行 ， 特 别 是 对 市 民 的 服务 将 会 大 量 自 动 化 ， 市 政 管理 包 
括 交 通 管理 、 警 察 、 安 全 监控 等 将 会 大 量 使 用 AI。 


国防 车 事 


用 来 自动 驾驶 汽车 的 技术 也 可 以 用 来 驾驶 坦 殉 。 无 人 机 已 经 成 了 
美国 反 臣 战争 的 重要 武器 ， 按 现在 的 发 展 速 度 ， 下 一 场 空 成 将 不 会 再 
有 飞行 员 。 我 们 在 下 一 章 还 会 详细 讨论 AI 对 战争 的 影 啊 。 


旅游 


未 来 你 的 个 人 智能 助理 比 家 人 还 熟悉 你 ， 你 只 要 说 “ 想 去 巴西 玩 
一 周 ”， 上 所 有 的 行程 就 都 安排 好 了 。 


教育 


“高 考 机 器 人 ”能 够 比 高 中 毕业 生 考 取 更 高 的 分 数 只 是 向 大 众 演 
示 AI 的 可 能 性 。 真 正 的 冲击 是 在 目前 在 线 教育 内 容 基础 上 的 、 个 性 化 
的 智能 老师 、 自 动 评测 和 答疑 等 。 当 个 性 化 智能 教育 发 展 到 一 定 程 
度 ， 很 有 可 能 会 彻底 颠 履 目前 的 教育 ， 例 如 分 散 的 虚拟 学 习 社 区 有 可 
能 取代 集中 式 的 学 校 ， 按 需 学 习 的 终身 教育 有 可 能 取代 小 学 到 大 学 的 
专门 教育 。 


农业 


今天 的 农业 已 经 开始 大 规模 使 用 无 人 机 等 先进 技术， 天 气 、 土 
坟 、 农 作物 、 市 场 信息 等 可 以 帮助 农民 更 精准 地 种 植 。 


1. 假设 汽油 3 美元 /加 仓 ， 特 斯 拉 同 等 级 汽油 车 油耗 16 英 里 /加 仑 ，2017 年 电费 0. 25 美 
元 / 度 ， 特 斯 拉 4 英 里 / 度 ， 所 以 每 16 英 里 的 成 本 是 0. 25X4=1 美 元 ， 这 样 每 驾驶 同样 16 
英里 距离 的 4 度 电 可 以 比 一 加 仓 油 省 2 美元 ， 这 样 电池 成 本 相当 于 12 000 美 元 /2 美元 =6 
000 加 仑 ，6 000X16=96 000 英 里 ， 一 辆 车 平均 殴 驶 10 万 英里 。 所 以 正好 把 电池 成 本 
赚 回 来 。 (1 英里 =1. 609 千 米 ) 


AI 的 作用 将 不 止 于 颠 履 商 业 ， 还 会 有 更 深刻 和 长 期 的 影响 。 
本 章 负 责 开 脑 洞 ， 理 解 了 本 章 就 能 知道 下 一 代 该 如 何 做 好 准备 。 
这 一 章 也 可 以 直接 跳 进来 读 ， 但 最 好 能 先 读 前 两 章 。 


我 们 在 上 一 章 摘 述 了 AI 在 短期 内 会 对 商业 和 生活 造成 的 影响 ， 但 
我 们 很 难 想象 更 长 期 (30 50 年 ) 的 影响 。 虽 然 预测 长 远 的 未 来 很 难 ， 
但 是 如 果 能 深刻 理解 AI 的 本 质 ， 束 能 对 未 来 的 方向 有 感觉 。2007 年 芋 
果 手 机 的 发 布 开启 了 移动 互联 网 的 一 波 巨 浪 ， 当 时 对 移动 互联 网 有 两 
种 不 同 的 观点 。 一 种 观点 认为 移动 互联 网 和 个 人 电脑 互联 网 有 完全 不 
同 的 性 质 ， 会 出 现 全 新 的 杀手 级 应 用 。 另 一 种 观点 《主要 是 个 人 电脑 
互联 网 的 部 分 大 佬 ) 认为 手机 无 非 是 个 人 电脑 的 延伸 ， 比 原来 的 网 
站 、 搜 索 和 游戏 等 多 了 一 块 显 示 屏 幕 而 已 。 笔 者 是 中 国 最 早 从 事 移动 
互联 网 的 专业 人 士 ， 基 于 手机 和 个 人 电脑 的 本 质 区 别 在 于 手机 的 定位 
功能 ， 笔 者 曾经 预测 未 来 杀手 级 应 用 一 定 和 定位 功能 有 关 ， 而 且 不 会 
是 当时 大 家 都 能 想到 的 找 加 油 站 、 订 餐馆 这 样 的 “ 浅 层 定位 应 用 ”， 
也 一 定 会 产生 新 的 巨头 。 果 不 其 然 ， 出 行 类 的 应 用 成 为 移动 互联 网 的 


杀手 级 应 用 ， 创 造 出 了 Uber、 沉 滴 出 行 这 样 的 个 人 电脑 互联 网 巨头 之 
外 的 新 的 移动 互联 网 巨头 。 


基于 深度 学 习 的 AI 本 质 


数据 之 间 相 关 性 的 友 现 和 记忆 


读 过 第 三 章 的 读者 能 体会 到 神经 网 络 最 本 质 的 特点 是 发 现 并 记忆 
数据 中 的 相关 性 。 例 如 ， 看 了 很 多 汽车 的 图 片 后 就 会 友 现 汽车 部 有 四 
个 轮子 。 人 的 大 脑 对 图 片 这 类 直观 的 数据 间 的 相关 性 也 能 发 现 一 部 分 
并 记 住 ， 这 就 是 默 知 识 。 但 当 数 据 量 很 大 ， 又 不 直观 时 ， 例 如 股票 市 
场 的 数据 、 复 杂 系 统 〈 例 如 人 体 、 核 电站 ) 内 部 的 数据 ， 人 就 不 行 
了 。 而 神经 网 络 却 应 付 自 如 ， 一 眼 就 能 发 现 数据 之 间 的 关系 并 记 住 ， 
这 就 是 暗 知 识 。 下 回 再 遇 到 类 似 的 数据 ， 马 上 就 能 做 出 判断 。 随 独 神 
经 网 络 的 规模 增 大 神经 元 数目 和 神经 元 之 间 的 连接 数目 ) ， 机 器 能 
够 处 理 人 根本 无 法 企及 的 大 规模 的 复杂 数据 。 


海量 记忆 基础 上 的 细微 差别 的 识别 


机 器 学 习 需 要 大 量 的 数据 ， 主 要 是 让 机 器 “看 到 、 记 住 ” 数 据 中 
呈现 出 的 各 种 模式 。 有 点 像 小 孩 玩 万 花 简 ， 数 据 就 是 装 入 万 花 位 中 的 
彩色 玻璃 碎片 ， 不 停 地 转动 玻璃 棱镜 就 是 不 同 的 算法 〈 对 应 神经 网 络 
中 不 同 的 连接 ) 。 一 组 有 限 的 数据 中 埋藏 着 无 数 排列 组 合 出 来 的 图 
样 。 因 为 机 器 的 记忆 比 人 的 记忆 准确 ， 而 且 量 大 ， 机 器 可 以 每 秒 转 几 
亿 次 万 花 简 ， 很 快 就 能 看 完 并 且 记 住所 有 的 图 样 。 所 以 机 器 学 习 可 以 
发 现 数 据 中 隐藏 的 所 有 细微 区 别 。 


基于 以 上 原理 ， 机 需 学 习 适 合 做 极其 复杂 的 决策 ， 例 如 制定 像 健 
康 保险 这 样 极其 复杂 的 公共 政策 ， 策 划 诸 如 诡 曼 撒 登 陆 这 样 包含 大 量 
变量 的 军事 行动 。 

这 两 个 AI 的 本 质 其 实 也 正 是 暗 知识 的 两 个 特点 。 基 于 以 上 两 个 特 
点 ， 我 们 看 看 未 来 会 出 现 哪 些 远 超 人 类 的 颠覆 性 的 超级 应 用 。 


科研 加 速 


一 个 科学 研究 的 过 程 可 以 分 为 以 下 几 个 步 又。 

(1) 提出 问题 或 选择 要 解决 的 问题 。 

(2) 学 习 研 究 关 于 这 个 问题 已 经 发 表 的 研究 文献 。 

(3) 根据 研究 文献 和 研究 者 的 经 验 提 出 假设 。 

(4) 设计 验证 假设 的 实验 。 

(5) 进行 实验 和 整理 实验 数据 。 

(6) 根据 实验 结果 判断 假设 是 否 成 立 。 

(7) 如 果 假 设 不 成 立 ， 返 回 第 (2) 步 或 第 (3) 步 ， 提 出 新 的 假 


在 这 个 流程 中 最 花 时 间 的 有 三 个 环节 : 研究 文献 、 做 实验 和 整理 
数据 。 在 这 三 个 环节 中 ， 机 器 学 习 都 可 以 部 分 甚至 全 部 取代 人 。 获 取 
相关 的 文献 ， 阅 读 、 理 解 并 总 结 已 经 成 为 科研 的 瓶颈 之 一 。 根 据 源 太 
华 大 学 的 研究 ， 自 从 1965 年 以 来 共有 5 000 万 篇 科学 文章 发 表 ， 现 在 每 
年 新 发 表 的 文章 是 250 万 篇 。 关 于 某 个 能 够 抑制 癌 细 胞 的 蛋白 质 的 论文 
就 达到 70 000 篇 。 一 个 科学 家 即使 一 天 读 10 篇 文献 ， 每 个 工作 日 都 
读 ， 一 年 也 只 能 读 2 500 篇 ， 所 以 大 部 分 的 研究 结果 都 会 被 束之高阁 。 


使 用 AI 可 以 通过 自然 语言 理解 找到 相关 的 所 有 文献 。 例 如 一 个 叫 作 
Iris《〈 艾 瑞 斯 ) 的 AI 软件 可 以 这 样 做 科研 : 首先 从 一 个 关于 这 个 研究 
题目 的 演讲 开始 。 这 个 演讲 通常 是 本 领域 的 一 位 著名 科学 家 做 的 几 十 
分 钟 的 概述 性 报告 ， 例 如 TED (美国 著名 讲坛 ) 大 会 的 演讲 。Iris 先 使 
用 自然 语言 处 理 算 法 分 析 演 讲 的 脚本 ， 挖 掘 从 开放 渠道 获取 的 学 术 文 
献 ， 碍 找到 与 讲座 内 容 相关 的 关键 论文 ， 然 后 将 相关 的 研究 论文 分 组 
并 进行 可 视 化 ，Iris 目 前 可 以 达到 70% 的 准确 率 ， 下 一 步 是 用 人 工 帮 
助 标注 文献 使 机 器 匹配 精度 增加 。 当 机 器 能 够 理解 文献 的 内 容 和 结构 
时 ， 至 少 可 以 帮助 科学 家 总 结 出 在 一 个 科研 领域 中 已 经 提出 的 问题 ， 
已 经 提出 过 的 假设 及 其 验证 ， 已 经 做 过 的 实验 和 结果 。 机 器 甚至 能 根 
据 文 章 的 逻辑 自 洽 性 对 文章 结果 提出 疑问 。 用 机 器 阅读 文献 的 一 个 重 
要 作用 是 能 够 对 前 人 的 工作 一 览 无 余 ， 不 至 于 做 许多 重复 性 的 工作 。 
今天 的 科研 越 来 越 依赖 于 实验 ， 而 实验 的 准备 、 操 作 和 数据 整理 
经 党 耗 时 耗 力 。 机 器 学 习 可 以 大 大 加 快 实验 进程 。2001 年 的 诡 贝 尔 物 
理 奖 颁发 给 了 美国 的 埃 里 元 。 康 奈 尔 (Eric Cornell) 等 三 位 实验 物 
理学 家 。 他 们 的 成 果 是 用 激光 器 和 磁场 创造 出 了 自然 界 不 存在 的 物质 
的 第 四 种 状态 : 玻 色 - 爱 因 斯 坦 凝聚 态 。 物 质 在 自然 界 的 三 种 状态 根据 
温度 不 同 分 别 是 固态 、 液 态 和 气态 。 当 温度 降低 至 非常 接近 绝对 零度 
时 《实验 上 永远 无 法 达到 绝对 零度 ) ， 物 质 就 会 进入 凝聚 态 (一 种 气 
态 的 、 超 流 性 的 物质 状态 )。 凝 聚 态 物质 有 很 多 特性 ， 例 如 对 地 球 磁 
极 和 引力 场 极为 敏感 ， 光 线 在 该 物质 中 会 延迟 ， 等 等 。 基 于 印度 科学 
家 玻 色 的 计算 ， 爱 因 斯 坦 于 1924 年 预测 了 这 种 物质 的 存在 以 后 ， 科 学 
家 一 直 想 在 实验 室 验 证 出 来 。1995 年 ， 这 三 位 科学 家 经 过 多 年 的 实 
验 ， 用 一 套 非常 复杂 的 实验 装置 终于 制造 出 了 物质 的 凝聚 态 。 图 6. 1 是 
这 个 实验 的 示意 图 ， 透 镜 内 有 一 小 块 物质 ， 透 镜 外 有 许多 激光 束 。 激 
光 打 在 物质 上 可 以 约束 物质 内 分 子 的 运动 ， 从 而 降低 物质 的 温度 。 图 
6. 2 是 实验 设备 的 核心 部 分 ， 图 6. 3 是 实验 设备 的 全 貌 。 可 以 看 出 ， 这 
套 实验 装置 非常 复杂 ， 可 以 设置 的 参数 非常 多 ， 如 果 每 一 种 参数 的 排 
列 组 合 都 去 试 ， 到 宇宙 终结 可 能 都 试 不 出 来 。 而 人 有 许多 直觉 可 以 大 


大 加 快 实验 。 获 奖 的 三 位 物理 学 家 摸索 了 很 多 年 才 终 于 造 出 了 凝聚 
态 。2016 年 5 月 17 日 ， 来 目 澳大利亚 新 南 威尔士 大 学 和 澳大利亚 国立 大 
学 的 研究 团队 使 用 机 器 学 习 从 头 开 始 操作 这 样 的 实验 《反复 设置 调整 
实验 设备 的 各 种 参数 直到 产生 凝聚 态 物 质 ) ， 机 器 学 习 竟 然 不 到 一 个 
小 时 束 成 功 制 造 出 了 这 种 凝聚 态 物 质 。 该 团队 希望 通过 进一步 借助 A 
以 更 快 的 速度 构建 更 大 的 这 类 物质 。 


图 6.1 凝 聚 态 设备 示意 图 : 不 同方 向 的 激光 束 约束 分 子 运动 造成 凝聚 态 物质 ( 腔 体 
内 ) 


图 片 来 源 : https://plato. stanford. edu/entries/physics-exper iment。 


图 6.2 凝 聚 态 实验 设备 的 核心 部 分 


图 片 来 源 : https://plato. stanford. edu/entries/physics-exper iment。 


图 6.3 凝 聚 态 实验 设备 全 狐 
图 片 来 源 : https://plato. stanford. edu/entries/physics-exper iment。 
科学 实验 的 第 三 个 环节 是 收集 整理 数据 ， 这 更 是 AI 的 优势 。 其 实 
在 科学 界 目 前 还 有 一 个 瓶 贷 束 是 研究 论文 的 审核 ， 要 发 表 的 论文 太 
多 ， 能 有 水 平和 时 间 对 其 进行 审核 的 人 太 少 。 机 器 学 习 可 以 大 大 加 快 


这 个 过 程 ， 例 如 可 以 检查 该 论文 是 否 抄 匀 或 者 和 已 经 发 表 的 结果 有 冲 
突 等 。 


科学 研究 中 最 难 被 机 器 取代 的 是 提出 假设 ， 但 是 IBM 的 一 个 团队 宣 
称 他 们 的 系统 可 以 做 到 。 也 束 古 说 ， 他 们 的 AI 可 以 通过 挖掘 学 术 文献 
目 动产 生 科 学 假设 。 而 且 ， 宣 称 他 们 的 算法 可 以 用 来 做 出 新 的 科学 发 
现 。 他 们 的 目标 古 将 文本 挖掘 与 可 视 化 和 分 析 结 合 起 来 ， 以 便 识别 事 
实 ， 并 提出 “新 的 、 有 趣 的 、 可 以 测试 的 、 可 能 是 真实 的 ”假设 。 

人 类 过 去 500 年 来 的 进步 主要 依靠 科学 技术 的 进步 ， 而 且 这 种 进步 
还 在 加 速 。 随 着 AI 的 发 展 ， 科 学 发 现 可 能 会 加 速 ， 这 意味 着 技术 进步 
会 进一步 加 快 ， 反 过 来 义 会 加 快 科学 的 进步 。 例 如 量子 计算 依赖 于 材 


料 科 学 的 进展 ， 一 旦 量子 计算 取得 突破 ， 计 算 能 力 束 可 能 比 现在 提高 
儿 个 数量 级 ，AI 能 力 的 提高 义 会 进一步 加 快 科 学 进展 和 加 速 实验 速 
度 ， 如 此 循环 下 去 。 


另外 一 个 加 速 是 用 AI 改进 AI 。 人 谷歌 和 Facebook 都 开始 研究 自动 机 
器 学 习 ， 通 过 强化 学 习 的 模型 ， 让 机 器 不 仅 不 断 地 调整 参数 ， 而 且 能 
够 选择 不 同 的 神经 网 络 模型 。 在 很 多 情况 下 自我 学 习 的 性 能 都 可 以 和 
人 设计 出 来 的 性 能 相 比 ， 机 器 有 时 还 会 选择 人 类 想不到 的 模型 ， 甚 至 
有 人 开始 探索 如 何在 机 器 学 习 里 模仿 人 类 的 想象 和 创新 。2017 年 底 ， 
谷歌 推出 由 AI 自主 “孕育 ”出 的 “ 子 AI”， 该 “ 子 AI” 被 取 名 为 
“NASNet”， 研 究 人 员 在 ImageNet 图 像 分 类 和 C0C0 目 标识 别 两 个 数据 
集 上 ， 对 NASNet 进 行 了 测试 ， 在 验证 集 上 的 预测 准确 率 达 到 了 82. 7%， 
比 之 前 公布 的 人 工 智 能 产品 的 结果 好 1. 2%， 效 率 也 提高 了 4%。 目 前 这 
些 研 究 还 处 在 早期 阶段 。 一 旦 这 类 循环 加 速 技术 成 熟 ， 就 会 使 技术 迅 
速达 到 一 个 新 的 高 度 。 

科学 的 本 质 是 受 控 实验 。 人 类 通过 控制 一 组 变量 (例如 物理 实验 
中 的 物体 位 置 和 受 力 等 ， 化 学 实验 的 温度 和 压力 等 ) 来 测量 另外 一 些 
变量 〈 例 如 物理 实验 中 物体 的 速度 ， 化 学 实验 中 的 气体 体积 ) 的 变 
化 。 科 学 定律 就 是 可 控 变 量 和 测量 变量 之 间 的 关系 。 当 人 类 完全 掌握 
了 某 一 类 关系 后 ， 就 可 以 通过 制造 仪器 把 原来 的 测量 变量 变 为 可 控 变 
量 ， 用 增 大 的 可 控 变 量 集 再 来 继续 发 现 它们 和 新 的 测量 变量 的 关系 ， 
这 就 是 科学 进步 的 本 质 ， 所 以 仪器 就 是 某 一 类 科学 定律 的 物化 。 科 学 
的 进展 完全 依赖 于 能 否 完全 掌握 某 个 科学 定律 并 且 把 该 定律 变 成 仪 
器 。 所 以 科学 的 进展 可 以 分 为 三 个 步骤 。 

(1) 提出 假设 : 某 一 组 可 控 变 量 和 男 一 组 可 测量 变量 可 能 的 关 


系 。 


(2) 设计 实验 : 验证 可 控 变 量 和 可 测 变量 之 间 的 关系 。 


(3) 如 采 实 验 不 能 验证 ， 就 重新 回 到 步骤 《1) 。 如 果 能 够 验 
证 ， 束 把 验证 过 的 关系 制造 成 仪器 ， 使 原来 的 可 测 变 量变 为 可 控 变 


量 。 然 后 回 到 步骤 〈1) 。 


机 需 学 习 在 每 个 步骤 中 都 能 加 快速 度 。 在 步骤 《1) ， 机 器 学 习 可 
以 通过 阅读 历史 文献 提出 大 量 可 能 的 组 合 。 虽 然 在 大 量 的 备 选 假设 中 
最 终 还 要 科学 家 定 于 为 哪个 做 实验 ， 但 机 器 可 以 帮助 科学 家 想 得 更 全 
面 。 在 步骤 《2) 最 伦 时 间 的 是 改变 可 控 变 量 的 值 来 测量 可 测 变量 ， 这 
正 是 机 器 的 拿手 好 戏 。 在 收集 、 整 理 、 分 析 数 据 方面 机 器 比 人 要 快 ， 
也 更 准确 。 在 步骤 《3) 制造 仪器 方面 又 分 为 设计 、 实 验 和 制造 三 个 步 
又 ， 机 器 学 习 在 实验 和 制造 上 都 能 加 快速 度 。 可 以 想象 在 不 久 的 将 来 
会 出 现 “机 顺 人 研究 生 ”， 人 类 科学 家 给 机 器 一 个 大 致 的 研究 方 癌 ， 
当 机 噩 遇 到 困难 时 请 教 一 下 导师 ， 剩 下 的 大 部 分 研究 工作 融 是 机 需 目 
己 做 了 。 它 们 不 知 疲倦 ，7 X24 小 时 做 研究 ， 阅 读 速 度 是 人 类 研究 生 
的 一 亿 售 ， 测 量 分 析 数 据 速 度 是 人 类 研究 生 的 一 万 倍 。 只 要 有 电力 和 
算 力 ， 世 界 上 可 以 有 几 十 亿 个 这 样 的 “研究 生 ” 在 研究 人 类 关心 的 各 
种 诬 题 。 


唐诗 高 手 


机 器 学 习 不 仅 在 科学 技术 的 进步 上 大 显 神威 ， 而 且 也 开始 进入 人 
文 领域 。 下 面 的 四 首 律诗 中 有 两 首 是 人 写 的 ， 两 首 是 机 絮 写 的 。 


云 峰 


白云 生 处 起 高 峰 ， 
鬼 算 神 工 造化 成 。 
古往今来 谁 可 上 ， 
九重 宫阙 握 权 衡 。 


画 松 


孤 耐 凌 节 护 ， 
根 枝 术 落 无 。 


翡 秋 


幽 径 重 寻 黯 碧 苔 ， 
倚 麻 狐 似 待 君 来 。 
此 生 永 失 天 台 路 ， 
老 凤 秋 梧 各 自 启 。 


飞花 轻 酒 雪 欺 红 ， 
雨 后 春 风 细 柳 工 。 
一 夜 东 有 君 无 限 眉 ， 
不 知 何 处 砚 青松 。 


壬 告 诉 读者 答案 之 前 ， 先 看 看 机 费 写 证 的 原理 。 把 机 絮 写 诗 的 原 
理 讲 得 最 清楚 的 芮 过 于 《红楼 梦 》 里 的 林 集 玉 。 在 《红楼 梦 》 第 四 十 
八 回 中 ， 被 醉 宝 钢 带 进 大 观 园 的 姑 女 香 净 让 焦 玉 教 她 写 诗 : 


党 玉 道 : “什么 难事 ， 也 值得 去 学 ! 不 过 是 起 承 转 合 ， 当 中 
承 转 是 两 副 对 子 ， 平 声 对 扑 声 ， 虚 的 对 实 的 ， 实 的 对 虚 的 ， 若 是 
果 有 了 奇 名 ， 连 平 天 虚实 不 对 都 使 得 的 。” 香 萎 笑 道 : “ 怪 道 我 
常 弄 一 本 旧 诗 偷 空 儿 看 一 两 首 ， 又 有 对 的 极 工 的 ， 又 有 不 对 的 ， 
又 听见 说 “一 三 五 不 论 ， 二 四 六 分 明 ”。 看 古人 的 诗 上 亦 有 上 顺 
的 ， 亦 有 二 四 六 上 错 了 的 ， 所 以 天 天 疑惑 。 如 今 听 你 一 说 ， 原 来 
这 些 格 调 规 给 竟 是 末 事 ， 只 要 词句 新 奇 为 上 。” 售 玉 道 : “ 正 是 
这 个 道理 ， 词 名 究竟 还 是 末 事 ， 第 一 立意 要 紧 。 若 意趣 真 了 ， 连 
词句 不 用 修饰 ， 自 是 好 的 ， 这 叫 作 “不 以 词 害 意 ” 。” 香 鞭 笑 
道 : “我 只 爱 陆 放 公 的 诗 “ 重 帘 不 卷 留 香 久 ， 十 砚 微 止 聚 杜 
多 ” ， 说 的 真有 趣 ! ” 舍 玉 道 : “ 断 不 可 学 这 样 的 诗 。 你 们 因 不 
知 诗 ， 所 以 见 了 这 浅 近 的 就 爱 ， 一 入 了 这 个 格局 ， 再 学 不 出 来 
的 。 你 只 听 我 说 ， 你 车 真心 要 学 ， 我 这 里 有 《 王 摩 诗 全 集 》 你 且 
把 他 的 五 言 律 读 一 百 首 ， 细 心 揣摩 迁 熟 了 ， 然 后 再 读 一 二 百 首 老 
杜 的 七 言 律 ， 次 再 李 青 莲 的 七 言 绝句 读 一 二 百 首 。 肚 子 里 先 有 了 
这 三 个 人 作 了 底子 ， 然 后 再 把 陶渊明 、 应 到 ， 谢 、 阮 、 广 、 鲍 等 
人 的 一 看 。 你 又 是 一 个 极 聪敏 伶俐 的 人 ， 不 用 一 年 的 工夫 ， 不 榴 
不 是 诗 丛 了 ! ” 


每 玉 说 的 第 一 件 事 是 格律 ， 押 韵 合 纤 ， 平 八 对仗。 这 是 律诗 的 基 
本 规则 ， 属 于 作 诗 的 明知 识 。 而 词语 之 间 的 相关 性 ， 也 即 一 个 词 出 现 
在 另 一 个 词 后 面 的 概率 ， 对 诗人 来 说 则 是 默 知 识 。 学 习 这 些 默 知识 是 
机 咒 最 擅长 的 ， 机 器 通过 大 量 的 阅读 ， 对 每 个 词 后 面 出 现 什 么 词 部 有 
了 “感觉 ”。 侈 玉 说 的 第 二 件 事 是 训练 集 要 大 ， 要 多 样 化 。 陆 游 一 生 
写 了 万 余 首 诗 ， 但 一 个 诗人 毕竟 有 局 限 性 ， 例 如 陆游 的 诗 题 材 单调 ， 
意境 空 玻 。 如 果 香 砍 只 学 陆游 的 诗 就 会 像 偶 玉 说 的 那样 “一 入 了 这 个 
格局 ， 再 学 不 出 来 的 ”， 这 就 是 机 器 学 习 里 面 当 训练 数据 集 太 小 时 出 
现 的 “过 度 拟 合 ”问题 。 所 以 集 玉 让 香 秦 学 王 维 、 杜 甫 、 李 白 等 不 同 
风格 的 诗人 ， 王 维 的 空灵 幽 远 ， 杜 责 的 翡 天 帜 人 ， 李 白 的 潇洒 取 放 ， 
都 会 避免 “过 度 拟 合 ”， 多 种 风格 的 混合 才能 出 新 意 。 


机 器 作 诗 的 原理 和 人 学 作 诗 类 似 ， 本 质 上 也 是 模式 识别 ， 通 过 大 
量 学 习 识别 然后 记忆 平 八 、 对 会、 押韵 、 词 句 的 常见 组 合 ， 即 一 个 词 
出 现在 另 一 个 词 后 面 的 概率 。 诗 歌 是 文字 的 一 部 分 ， 是 一 个 前 后 有 相 
天性 的 序列 数据 流 ， 第 三 章 里 提 到 过 ，RNN 最 适合 序列 数据 处 理 。 产 生 
诗歌 的 思路 有 两 种 。 第 一 种 思路 是 将 诗歌 的 整体 内 容 作 为 训练 语 料 送 
给 RNN 语 言 模型 进行 训练 。 训 练 完成 后 ， 先 给 定 一 些 初 始 内 容 ， 然 后 就 
可 以 按照 语言 模型 输出 的 概率 分 布 进行 采样 得 到 下 一 个 词 ， 不 断 地 重 
复 这 个 过 程 就 产生 完整 的 诗歌 。 具 体 步 又 如 下 : 首先 由 用 户 给 定 的 天 
键 词 生 成 第 一 句 ， 然 后 由 第 一 句 话 生成 第 二 句 话 ， 由 第 一 句 话 和 第 二 
句 话 生成 第 三 句 话 ， 重 复 这 个 过 程 ， 直 到 诗歌 全 部 生成 。 访 模型 由 三 
部 分 组 成 。 

(1) 卷 积 语句 模型 (Convolutional Sentence Model1，CSM) : 
这 个 卷 积 模型 用 于 获取 一 句 话 的 问 量 表示 。 

(2) 复发 上 下 文 模型 (Recurrent Context Model1，RCM) : 句子 
级 别 的 RNN， 根 据 历史 生成 句子 的 同 量 ， 输 出 下 一 个 要 生成 句子 的 上 下 
文 同 量 。 

(3) 复发 生成 模型 (Recurrent Generation Model，RGM) : 字 
符 级 别 的 RNN， 根 据 RCM 输 出 的 上 下 文句 量 和 该 句 之 前 已 经 生成 的 字 
符 ， 输 出 下 一 个 字符 的 概率 分 布 。 解 码 的 时 候 根据 RGM 模 型 输出 的 概率 
和 语言 模型 概率 加 权 以 后 ， 生 成 下 一 句 诗歌 ， 由 人 工 规则 保证 押韵 。 

第 二 种 思路 是 把 写 诗 看 成 一 个 翻译 过 程 。 将 上 一 句 看 成 源 语言 ， 
把 下 一 句 看 成 目标 语言 ， 用 机 器 翻译 模型 进行 翻译 ， 并 加 上 平 人 押韵 
等 约束 ， 得 到 下 一 句 。 通 过 不 断 地 重复 这 个 过 程 ， 得 到 一 首 完 整 的 诗 
歌 。 

现在 到 了 揭 开 谜底 的 时 候 : 第 三 首 和 第 四 首 诗 是 机 器 写 的 ， 仔 细 
看 还 是 能 看 出 来 。 一 首 好 诗 首 先是 要 语句 自然 流畅 ， 意 境 浑 然 天 成 。 
第 二 首 的 第 一 句 “ 抓 耐 凌 节 护 ” 根 本 不 知 所 云 。 除 了 句子 不 通顺 ， 两 
首 机 器 写 的 诗 还 很 难 让 读者 有 男 面 感 。 一 首 好 诗 重 要 的 是 意境 ， 正 如 


袋 玉 所 说 : “词句 完 竟 还 是 末 事 ， 第 一 立意 要 紧 。 若 意趣 真 了 ， 连 词 
句 不 用 修饰 ， 目 是 好 的 ， 这 叫 作 “不 以 词 害 意 ”。 ”目前 机 器 写 许 像 
一 个 缺乏 天 资 的 但 极为 刻 知 的 诗歌 爱好 者 ， 怎 么 做 都 无 法 有 “ 意 
境 ”。 能 够 打动 人 的 好 诗 需要 “ 触 景 生 情 ”， 并 且 能 引起 读者 的 共 
吗 。 这 更 是 目前 机 右 学 习 还 无 法 企及 的 境界 。 最 绝妙 的 诗歌 除了 以 上 
儿 上 点， 还 要 能 出 奇 出 新 ， 打 破 凋 规 ， 使 用 从 来 未 使 用 过 的 词句 组 合 但 
又 合情合理 。 正 如 集 玉 在 进一步 提 点 香 攻 时 所 说 : 


“可 领略 了 些 滋味 没有 ? ” 香 凌 笑 道 : “领略 了 些 滋味 ， 不 
知 可 是 不 是 ， 说 与 你 听 听 。 ”人 和合 玉 笑 道 : “ 正 要 讲究 讨论 ， 方 能 
长 进 。 你 且说 来 我 听 。?” 香 鞭 笑 道 : “ 据 我 看 来 ， 诗 的 好 处 ， 有 
口 里 说 不 出 来 的 意思 ， 想 去 却 是 通 真 的 。 有 似乎 无 理 的 ， 想 去 竟 
是 有 理 有 情 的 。” 党 玉 笑 道 : “这 话 有 了 些 意 思 ， 但 不 知 你 从 何 
处 见得 ? ” 香 鞭 笑 道 : “我 看 他 《 塞 上 》 一 首 ， 那 一 联 云 : “大 
漠 孤 烟 直 ， 长 河 落 日 圆 。” 想来 烟 如 何 直 ? 日 自然 是 圆 的 : 
这 “ 直 ” 字 似 无 理 ，“ 圆 ” 字 似 太 俗 。 合 上 书 一 想 ， 倒 像 是 见 了 
这 景 的 。 若 说 再 找 两 个 字 换 这 两 个 ， 况 再 找 不 出 两 个 字 来 。 还 
有 “渡头 余 落日 ， 墟 里 上 孤 烟 ”: 这 “ 余 ” 字 和 “上 ” 字 ， 难 为 
他 怎么 想来 ! 我 们 那 年 上 京 来 ， 那 日 下 晚 便 湾 住 船 ， 岸 上 又 没有 
和 人， 只 有 几 棵 树 ， 远 远 的 几 家 人 家 做 晚饭 ， 那 个 烟 竟 是 碧 青 ， 连 
云 直 上 。 谁 知 我 昨日 晚上 读 了 这 两 各， 倒 像 我 又 到 了 那个 地 方 去 
本 全 村 


上 面 香 萎 喜 欢 的 这 些 诗句 都 超越 了 技巧 层面 ， 进 入 灵感 和 男 面 的 
幽 微 层面 。 这 些 都 不 是 今天 以 学 习 数 据 之 间 相关 性 为 特征 的 机 右 学 习 
所 能 企及 的 。 所 以 真正 的 诗人 完全 不 必 担 心 被 AI 取代 ， 但 那些 无 病 别 
吟 ， 婴 融 学 舌 或 天 资 平 平 的 诗歌 爱好 者 只 能 和 机 器 诗人 去 疏 了 。 

同样 的 道理 ，AI 还 可 以 写 小 说 。 只 要 让 机 器 大 量 阅读 一 位 作者 的 
兰 作 ， 机 器 融 能 学 会 这 个 作者 的 文字 风格 。 和 作 许 、 画 男 一 样 ， 如 宋 


让 机 器 阅读 了 许多 作家 的 书 ， 机 器 的 写作 风格 就 是 “混搭 ”的 。 和 作 
诗 一 样 ， 机 器 写 的 小 说 可 能 情 市 完整 ， 文 字 通 畅 ， 但 永远 不 会 有 伟大 
作家 笔下 流 消 的 情感 和 闪烁 的 灵魂 。 

有 读者 一 定 会 问 ， 这 些 “ 有 灵感” 和 “意境 ”是 售 也 是 一 种 默 知 
识 ， 甚 至 暗 知 识 ? 当 机 器 更 复杂 时 是 否 终 将 能 模仿 ? 这 个 问题 并 不 容 
易 回 答 。 但 暂时 的 回答 是 “不 能 ”， 原 因 是 今天 的 机 器 没有 目 我 意 
识 ， 所 以 没有 情感 。 我 们 在 本 书 的 最 后 会 讨论 这 个 问题 。 


真 假 凡 。 高 


同样 的 原理 ， 机 器 在 看 过 大 量 的 绘画 作品 后 也 能 够 模仿 画家 的 风 


格 。 图 6. 4 是 一 张 典型 的 北欧 城市 图 片 。 


图 6.4 一 张 典 型 的 北欧 城市 图 片 


图 片 来 源 : https://www. businessinsider. com. au/the-science-how-vincent-van- 
gogh-saw-thewor 1d-2015-9。 


机 器 可 以 把 这 张 图 片 改造 成 凡 。 高 的 风格 。 图 6. 5 左边 是 凡 。 高 的 
名 画 《星空 》， 右 边 就 是 北欧 城市 图 片 的 “星空 化 ”。 
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图 6.5 用 凡 : 高 名 画 《 星 空 》 风 格 画 的 北欧 城市 


图 片 来 源 : Leon Gatsy of Bethge Lab in Germany 
https://www. businessinsider. com. au/thescience-how-vincent-van-gogh-saw- 
the-wor 1d-2015-9。 


机 絮 当 然 也 可 以 把 这 张 图 片 “ 马 带 斯 化 ”， 图 6. 6 中 大 边 是 马 蒂 斯 
的 名 画 《 戴 帽子 的 女士 》， 右 边 还 是 那 张 北欧 城市 图 。 


图 6.6 用 马 蒂 斯 风格 画 的 北欧 城市 


图 片 来 源 : Leon Gatsy of Bethge Lab in Germany 
https://www. businessinsider. com. au/thescience-how-vincent-van-gogh-saw- 
the-wor |d-2015-9 。 


从 这 两 张 改造 的 画 来 看 ， 机 器 的 模仿 可 以 说 是 惟妙惟肖 ， 其 中 色 
彩 、 笔 触 、 线 条 的 模仿 是 人 类 无 法 企及 的 。 这 种 模仿 是 典型 的 默 知 
识 ， 从 这 个 例子 可 以 看 出 机 器 对 默 知识 的 掌握 比 人 类 要 精细 得 多 。 


AI 不 仅 会 模仿 ， 而 且 会 创造 自己 的 风格 。 图 6. 7 是 来 自 罗 格 斯 大 学 
计算 机 系 艺 术 与 人 工 智 能 实验 室 、Facebook 人 工 智 能 研究 院 
(FAIR〉、 查 尔 斯 顿 学 院 艺 术 史 系 三方 联 合 小 组 用 机 器 生成 的 绘画 。 
该 研究 小 组 在 论文 中 称 ， 该 研究 中 提出 的 人 工 智 能 系统 是 一 个 创意 性 
的 对 抗 网 络 (Creative Adversary Network，CAN) ， 它 是 在 之 前 介绍 

过 的 生成 式 对 抗 性 网 络 系统 的 一 种 扩展 。 


> a pe 


图 6.7 创 意 对 抗 网 络 生成 的 图 画 

图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺 术 与 人 工 智 能 实验 室 。 
生成 对 抗 网 络 能 够 迭代 进化 、 模 仿 指定 数据 特征 ， 已 经 是 公认 的 
处 理 图 像 生 成 问题 的 好 方法 。 目 从 提出 以 来 相关 的 研究 成 果 不 少 ， 在 
图 像 增强 、 超 分 辨 率 、 风 格 转换 任务 中 的 效果 可 谓 是 怀 人 的 。 根 据 生 
成 对 抗 网 络 的 基本 结构 ， 鉴 别 絮 要 判断 生成 絮 生 成 的 图 像 古 否 和 其 他 
己 经 提供 给 鉴别 莫 的 图 像 是 同一 个 类 别 〈( 特 征 相 符 〉， 这 就 决定 了 最 
好 的 情况 下 输出 的 图 像 也 只 能 是 对 现 有 作品 的 模仿 。 如 果 有 创新 ， 就 


会 被 鉴别 器 识别 出 来 ， 残 达 不 到 目标 了 。 因 此 用 生成 对 抗 网 络 生 成 的 
艺术 作品 也 就 注定 会 缺乏 实质 性 的 创新 ， 艺 术 价值 有 限 。 图 6. 8 是 用 生 
成 对 抗 网 络 模型 实现 的 图 像 分 辨 率 增强 和 风格 转换 。 

风格 转换 


超 分 状 率 


图 6.8 用 生成 对 抗 网 络 模型 实现 的 图 像 分 辩 率 增强 和 风格 转换 

图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺术 与 人 工 智能 实验 室 。 

为 了 使 艺术 品 更 具有 创造 性 ， 该 研究 团队 在 生成 对 抗 网 络 的 基础 
上 提出 了 创意 对 抗 性 网 络 ， 研 究 团队 通过 15 一 20 世 纪 1 119 位 艺术 家 的 
81 449 幅 涵盖 了 多 种 风格 的 绘画 作品 训练 神经 网 络 。 然 后 邀请 人 类 参 
与 者 评估 人 工 智 能 的 艺术 作品 与 现实 艺术 家 的 两 组 作品 。 这 两 组 作品 
是 创造 于 1945 一 2007 年 的 抽象 表现 派 作品 ， 以 及 2017 年 巴塞 尔 艺术 博 
览 会 作品 。 图 6. 9 上 面 的 12 张 是 由 创意 对 抗 网 络 生成 的 人 类 评价 最 高 的 
画 ， 下 面 8 张 是 评价 最 低 的 画 。 图 6. 10 就 是 历年 巴塞 尔 艺 术 博 览 会 的 获 
SN 

可 以 看 到 ， 机 器 生成 的 艺术 作品 风格 非常 多 样 ， 从 简单 的 抽象 画 
到 复杂 的 线条 组 合 都 有 ， 内 容 层 次 也 有 区 分 。 而 研究 人 员 也 发 现 它们 
的 系统 可 以 其 电 人 类 观察 员 。 将 人 类 观察 艺术 家 创作 的 作品 和 机 器 创 


作 的 作品 时 的 反应 进行 对 比 ， 发 现 人 类 无 法 将 机 器 生成 的 作品 和 当代 
艺术 家 以 及 一 家 顶级 艺术 博览 会 上 的 作品 区 分 开 来 。 
7 C 全 二 f 


图 6.9 由 创意 对 抗 网 络 生成 的 图 画 


图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺术 与 人 工 智 能 实验 室 。 
We 本 


图 6.10 历 年 巴塞 尔 博览 会 的 获奖 作品 


图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺 术 与 人 工 智 能 实验 室 。 

创意 性 对 抗 网 络 是 如 何 工 作 的 呢 ? 与 生成 对 抗 网 络 系统 一 样 ， 创 
意 性 对 抗 网 络 也 使 用 两 个 子 网 络 。 鉴 别 器 被 赋予 了 一 套 有 风格 标签 的 
海量 艺术 作品 ， 例 如 文艺 复兴 时 期 、 巴 洛克 风格 、 印 象 主 义 或 表现 主 
义 ， 而 生成 费 则 无 法 获得 任何 艺术 作品 。 当 它 生 成 一 个 作品 时 ， 它 会 
从 侯 别 器 接收 两 个 信号 : 一 个 是 将 图 像 分 类 为 “艺术 或 非 艺 术 ”， 田 
一 个 是 “能 否 分 辨 图 像 是 哪 种 艺术 风格 ”。 

“艺术 或 非 艺术 ”与 “能 个 分 辨 艺术 风格 ”是 两 种 对 立 的 信号 ， 
前 一 种 信号 会 过 使 生成 器 生成 能 够 被 看 作 是 艺术 的 图 像 ， 但 是 假如 筷 


在 现 有 的 艺术 风格 范畴 中 惑 达到 了 这 个 目标 ， 鉴 别 硕 就 能 够 分 辨 出 图 
像 的 艺术 风格 了 ， 人 然后 生成 器 融会 受到 惩罚 。 这 样 后 一 种 信号 就 会 让 
生成 器 生成 难以 分 辨 风格 的 作品 。 所 以 两 种 信号 可 以 共同 作用 ， 让 生 
成 器 能 够 尽 可 能 探索 整个 创意 空间 中 艺术 作品 的 范围 边界 ， 同 时 最 大 
化 生成 的 作品 尽 可 能 游离 于 现 有 的 标准 艺术 风格 之 外 。 


这 种 “创作 ”在 本 质 上 是 非常 隐蔽 的 一 种 “混搭 ”， 和 作 诗 一 
样 ， 普 通 人 很 难 分 辨 真 伪 。 判 断 诗 还 可 以 用 “意境 ”“ 男 面 感 ”， 而 
判断 男 ， 特 别 是 抽象 画 几 乎 没有 人 类 可 以 依赖 的 直觉。 所 以 和 作 许 机 
器 人 不 同 ， 这 里 的 作画 机 器 人 掌握 的 不 只 是 默 知识 ， 而 且 进 入 了 上 暗 知 
识 的 领地 。 所 以 由 对 抗 生 成 网 络 这 种 机 器 “混搭 ”并 迭代 出 来 的 画 的 
确 可 以 乱 “ 真 ”。 这 样 的 机 器 可 以 在 短期 内 大 量 探索 不 同 的 风格 ， 让 
艺术 家 选择 或 给 艺术 家 以 灵感 。 

基于 类 似 的 原理 ，AI 作 曲 也 到 了 几乎 可 以 乱 真 的 地 步 。AI 作 曲 领 
域 的 领先 公司 Aiva Technologies 创造 了 一 个 AI 作曲 家 
Aiva (Artificial Intelligence Virtual Artist， 人 工 智 能 虚拟 艺 
术 家 ) ， 并 教 它 如 何 创作 古典 音乐 。 而 古典 音乐 一 直 以 来 被 视 为 一 种 
高 级 的 情感 艺术 ， 一 种 独特 的 人 类 品质 。Aiva Technologies 已 经 发 布 
了 第 一 张 专辑 ， 名 为 Cenres7s， 专 辑 包 含 不 少 单 曲 。 并 且 Aiva 的 音乐 
作品 能 够 用 在 电影 、 广 告 ， 甚 至 是 游戏 的 配乐 里 。2017 年 初 ，Aiva 通 
过 法 国 和 卢森堡 作者 权利 协会 “SACEM) 合法 注册 ， 成 为 人 工 智 能 领域 
第 一 个 正式 获得 世界 地 位 的 作曲 家 ， 其 所 有 的 作品 都 以 自己 的 普 名 拥 
有 版 权 。 


Aiva 背 后 使 用 了 强化 学 习 技 术 的 深度 学 习 算 法 。 强 化 学 习 告 诉 软 
件 系统 接 下 来 要 采取 什么 动作 以 通过 最 大 化 其 “累积 奖励 ”来 达到 菏 
种 目标 。 强 化 学 习 不 需要 标注 过 的 输入 和 输出 数据 ，AI 可 以 通过 数据 
目 行 改进 性 能 ， 这 使 AI 更 容易 捕获 在 创意 艺术 如 音乐 中 的 多 样 性 和 变 
化 。Aiva 束 是 通过 品读 巴赫 、 贝 多 芬 、 英 扎 特 等 最 着 名 的 作曲 家 的 古 


典 乐 革 的 大 数据 库 来 了 解 首 乐 作品 的 艺术 性 ， 目 行 谱写 出 了 一 些 新 的 
乐曲 。 


下 一 场 空 战 


美国 军 方 曾经 公布 了 一 段 无 人 机 打击 塔利班 武 沪 分 子 的 视频 。 在 
内 华 达 州 戈壁 滩 的 空调 机 房 中 ， 几 个 年 轻 军 人 坐 在 视频 终端 前 面 ， 操 
纵 着 半 个 地 球 之 外 的 阿富汗 山区 的 无 人 机 ， 当 视频 上 准确 锁定 地 面 的 
车 辆 目标 后 ， 操 作 员 就 像 打 视频 游戏 一 样 按 动 手柄 上 的 按钮 塔利班 
的 军车 顿时 起 火 ， 没 死 的 塔利班 武装 分 子 跳 下 卡车 四 处 逃命 。 在 夜 视 
仪 下 ， 这 些 逃 命 的 塔利班 武装 分 子 像 在 白人 一 样 看 得 清楚 ， 操 作 员 一 
一 锁定 他 们 ， 按 下 按钮 ， 目 标 变 成 一 团 火 海 。 这 里 的 操作 无 非 是 辨别 
和 锁定 目标 ， 具 有 人 工 智能 的 机 器 已 经 远 远 超出 人 类 。 内 华 达 机 房 的 
操作 员 完 全 可 以 被 取代 ， 一 切 由 机 器 完成 。 


美国 空军 开发 的 一 蒜 叫 作 ALPHA 的 自动 飞行 软件 ， 不 仅 在 每 一 场 和 
真人 的 对 决 中 都 打败 了 空军 飞行 教练 员 ， 甚 至 该 软件 在 驾驶 一 架 比 对 
手 飞 行 速度 慢 ， 导 弹射 程 短 的 飞机 时 也 能 打败 对 手 。 飞 机 的 自动 驾驶 
其 实 比 汽车 日 动 驾驶 更 适合 机 器 操作 。 第 一 ， 飞 行 员 的 大 量 训练 时 间 
古 学 会 读 懂 驾驶 舱 内 琳琅 满目 的 仪表 和 通过 各 种 仪表 数据 判断 该 如 何 
操作 ， 这 正 是 机 器 学 习 的 拿手 好 戏 。 第 二 ， 空 中 飞行 的 周边 环境 远 远 
比 地 面 驾驶 简单 。 同 时 ， 飞 机 上 的 各 种 传 感 顺 可 以 准确 地 感知 飞机 的 
空间 坐标 、 高 度 、 速 度 、 和 平衡、 风力、 温度 等 ， 在 这 种 情况 下 的 驾驶 
非常 适合 机 如 。 虽 然 空战 中 的 周边 环境 瞬 奶 万 变 ， 但 仍然 不 会 像 地 面 
一 样 拥挤 。 第 三 ， 也 是 最 重要 的 一 点 ， 反 应 快 。 人 类 从 大 脑 判断 到 肌 
肉 动作 至 少 要 0. 1 0. 3 秒 的 时 间 ， 而 机 器 可 以 在 百 万 分 之 一 秒 内 完成 。 
目前 的 飞机 和 武器 系统 的 反应 时 间 都 以 人 类 反应 时 间 为 下 限 ， 因 为 武 


需 反 应 再 快 人 跟 不 上 也 没 用 。 但 未 来 的 飞机 和 武 喜 设计 就 是 要 能 够 达 
到 机 械 反 应 速度 的 极限 ， 因 为 作为 操控 员 的 人 工 知 能 的 反应 时 间 主 要 
征 计算 时 间 ， 将 远 短 于 武器 的 机 械 反 应 时 间 。 几 乎 可 以 预计 下 一 代 备 
用 飞机 将 以 目 动 和 目 主 性 操控 为 主 ， 一 如 人 类 要 驶 的 飞机 一 定 打 不 过 
机 器 操纵 的 飞机 。 


目前 无 人 机 已 经 广泛 使 用 在 反 人 到 和 局 部 侦察 与 战斗 中 ,但 这 只 是 
序曲 。 以 人 工 智能 为 核心 能 力 的 新 型 武器 必 将 成 为 下 一 轮 军 备 竞 赛 的 
主要 目标 。 人 工 智能 对 未 来 军事 和 战争 的 影响 将 主要 体现 在 以 下 方 
面 。 


新 型 目 主 性 武器 的 开发 


最 早 的 自动 化 的 武器 就 是 导弹 ， 但 我 们 通 弟 并 不 把 导弹 称 为 人 工 
智能 武器 。 这 里 的 区 别 在 于 是 自动 化 (automated) 还 是 自主 化 
Cautonomous) 。 上 自动 化 是 确定 性 地 输入 感知 信号 产生 确定 性 的 输出 
反应 ， 而 自主 化 是 不 确定 性 地 输入 感知 信号 产生 一 定 概 率 分 布 的 输出 
反应 信号 ， 甚 至 是 一 个 从 未 见 过 的 输入 ， 通 过 推理 、 和 常识 和 经 验 产生 
一 个 最 佳 的 输出 。 五 角 大 楼 国防 科学 委员 会 在 2016 年 发 布 的 一 份 报告 
是 这 样 描述 的 : “要 实现 自主 ， 一 个 系统 必须 具备 基于 其 对 世界 、 自 
号 和 形势 的 认识 与 理解 ， 独 立 构建 和 选择 不 同 的 行动 路 线 以 便 实 现 其 
目标 的 能 力 。” 一 个 预先 设 定 了 打击 目标 的 导弹 是 自动 化 武器 ， 一 个 
放飞 到 塔利班 巢穴 上 衬 的 会 随机 应 变 的 捕食 者 无 人 机 是 自主 性 武器 。 
未 来 自主 性 武器 将 率先 在 各 类 飞行 器 上 全 面 普及 ， 进 而 开始 应 用 于 水 
上 和 水 下 ， 包 括 水 面 舰 船 与 潜艇 以 及 各 种 机 器 鱼 。 最 后 是 陆地 ， 包 括 
车 辆 、 坦 克 和 各 种 机 器 人 ， 又 、 狗 、 蛇 等 。 目 前 ， 以 色 列 已 经 部 署 了 
一 种 自主 的 防 辐射 无 人 机 Harop， 可 以 飞行 长 达 6 个 小 时 ， 只 在 敌人 防 
空 雷达 亮 起 的 时 候 进行 攻击 。 俄 罗斯 武器 生产 公司 Kalashnikov 已 经 抽 


造 出 了 一 把 全 目 动 AK-47 步 枪 ， 通 过 使 用 AI 确定 目标 瞄准 射击 ， 而 该 武 
需 准 备 回 俄 罗斯 军 方 供应 。 


电池 容量 是 野战 机 硕 人 的 瓶颈 


大 型 自主 性 武器 的 能 源 主要 还 是 热能 量 密度 高 的 石化 燃料 。 但 是 
内 燃 机 的 传动 远 不 如 电力 灵活 方便 ， 一 个 四 旋翼 的 无 人 机 要 用 内 燃 机 
驱动 传动 部 分 会 非常 复杂 。 所 以 很 多 小 的 自主 性 武器 例如 无 人 机 ， 机 
器 人 、 又 、 狗 、 必 等 最 理想 的 动力 来 源 是 电池 驱动 ， 但 是 以 目前 的 锂 
电池 容量 密度 〈 约 300 瓦 时 / 千克 ) 和 每 年 的 改进 程度 〈 约 5%) ， 在 短 
期 内 很 难 有 能 够 文 持 机 器 运行 长 达 一 天 的 电池 ， 在 野外 充电 和 换 电 池 
也 都 是 很 大 的 问题 。 除 了 锂电 池 ， 目 前 另 一 个 比较 有 和 希望 的 是 所 燃料 
电池 ， 与 锂电 池 相 比 ， 其 优势 是 充电 快 〈( 几 分 钟 而 不 是 几 个 小 时 )， 
单位 体积 或 重量 的 能 量 密度 也 更 高 ， 所 以 未 来 车 用 电池 很 可 能 以 氢 燃 
料 电 池 为 主 。 


军用 技术 将 落后 于 民用 技术 


人 工 乔 能 和 电子 、 信 息 产 业 类 似 ， 由 于 该 技术 在 民生 中 的 巨大 商 
业 前 景 ， 民 用 和 商用 对 该 技术 的 总 投入 要 大 于 军事 上 的 投入 。 民 用 和 
商用 通过 市 场 竞争 机 制 也 会 吸引 人 人 工 智能 方面 一 流 的 人 才 (如 创业 的 
回报 巨大 ) 。 由 于 开放 性 的 学 术 交 流 和 开源 软件 ， 民 用 技术 将 进展 神 
速 ， 巨大 的 商业 前 景 也 会 造成 空前 激烈 的 市 场 范 争 。 这 一 切 都 会 推动 
人 工 智 能 在 民用 和 商用 方面 快速 进展 。 而 军用 技术 的 发 展 则 会 落后 于 
民用 技术 ， 许 多 军用 技术 研发 最 便宜 的 方法 都 是 依托 在 民用 技术 之 
让 


大 规模 协同 作战 的 演进 


一 场 战役 的 规模 常常 受信 息 获取 和 传导 的 限制 。 在 今天 有 了 铺盖 
天 地 的 无 线 通信 后 ， 人 类 接收 信息 的 速度 和 反应 时 间 又 进一步 成 了 瓶 
贷 。 当 信息 接收 和 反应 都 由 机 器 接管 后 ， 一 次 战斗 和 战役 的 规模 可 以 
大 大 增加 。 如 果 都 是 机 器 之 间 互 相 协 调 ， 那 么 几 百 万 全 机 器 可 以 瞬间 
协同 行动 。 最 近 美 国 国防 部 新 型 武器 研发 部 公布 了 一 段 几 百 台 微 型 无 
人 机 “群舞 ”的 视频 。 当 战斗 机 在 沙漠 中 撤 下 几 百 台 无 人 机 后 ， 这 些 
无 人 机 会 自动 组 成 飞行 队 形 对 一 大 上 地 形 实 施 侦察 ， 还 可 以 随时 改变 
队 形 。 当 个 别 无 人 机 离队 时 ， 队 形 会 自动 调整 ， 当 离队 的 无 人 机 回 到 
群体 后 ， 队 形 又 会 自动 改变 。56 通 信 网 络 的 到 来 也 将 加 速 机 器 协同 的 
进程 。56G 的 高 带宽 、 低 功 耗 、 低 时 延 的 特点 能 够 保证 更 多 的 机 器 以 更 
少 的 耗 电 量 ， 做 出 更 为 敏捷 的 协作 。2018 年 韩国 平 昌 冬 奥 会 ， 在 56G 试 
验 网 络 的 支持 下 ， 英 特 尔 公司 用 1 218 架 无 人 机 组 成 了 奥运 五 环 、 运 动 
员 、 和 和 平 铝 等 图 案 进 行 灯 光秀 表演 ， 刷 新 了 “同时 放飞 数量 最 多 的 无 
人 机 ”的 吉 尼 斯 世界 纪录 。 〈( 见 图 6. 11) 


图 6.11 在 韩国 平 昌 冬 奥 会 上 1 218 架 无 人 机 组 成 的 奥运 五 环 
图 片 来 源 : https://zhuanlan. zhihu. com/p/33766210。 


苗 事 组 织 的 混成 化 、 单 官 化 和 局 平 化 


军队 之 所 以 分 为 不 同 的 兵种 ， 主 要 原因 是 武器 的 使 用 和 场景 不 
同 ， 一 个 人 很 难 成 为 多 面 手 ， 分 工 有 利于 提高 掌握 该 武器 的 撤 能 。 但 
当 武 器 自身 越 来 越 自 动 化 和 自主 化 时 ,分工 的 必要 性 就 降低 了 ， 混 合 
使 用 武 占 的 好 处 越 来 越 上 是 最。 所 以 今后 的 战争 可 能 不 再 是 陆 车 和 陆军 
打 ， 空 硅 和 空军 打 ， 海军 和 海军 打 ， 而 是 所 有 的 军种 一 起 打 。 和 军种 之 
间 的 界限 会 越 来 越 模糊 ， 其 至 会 取消 现 有 的 军种 。 

由 于 未 来 战争 前 端 主要 是 自动 化 和 自主 化 武器 在 拼搏 ， 所 以 需要 
的 血肉 之 氏 会 越 来 越 少 ， 一 个 人 可 以 协调 操控 大 批 目 主 化 武器 。 作 为 


传统 的 作战 第 一 线 的 “士兵 ”将 消失 ， 每 个 作战 人 员 部 是 一 个 指挥 
员 ， 所 以 未 来 的 趋势 不 是 “ 单 兵 化 ”而 是 “ 单 官 化 ”。 


军队 有 最 严格 的 层级 结构 。 传 统 军事 对 个 人 依赖 很 小 ， 制 胜 的 保 
障 是 一 个 巨大 团体 的 协调 行动 。 层 级 结构 能 保障 命令 和 信息 在 巨大 人 
群 中 最 快 地 传递 和 严格 地 执行 。 由 于 战斗 人 群 规模 的 缩小 和 个 体 ( 单 
官 ) 能 力 大 大 增加 ， 所 以 未 来 军队 将 像 今天 的 高 科技 公司 一 样 越 来 越 
重视 个 体能 力 和 能 动 性 。 这 一 切 都 会 导致 未 来 的 军队 组 织 越 来 越 书 平 
化 5 


军事 组 织 从 以 武器 为 中 心 转向 以 数据 为 中 心 


军事 组 织 的 结构 取决 于 什么 样 的 结构 最 能 打 胜 仗 。 传 统 苗 事 组 织 
围绕 武器 组 织 、 物 流 组 织 ， 新 军事 组 织 将 围绕 数据 组 织 。 未 来 战争 的 
前 问 主 要 是 钢铁 机 器 ， 后 端 则 是 大 量 人 和 计算 能 力 负 员 数据 收集 与 处 
理 。 由 于 数据 的 复杂 性 ， 组 织 将 划分 为 数据 收集 、 存 储 、 处 理 、 决 
策 。 每 一 种 武 右 及 其 行动 轨迹 和 效果 ， 对 后 全 军事 人 员 来 说 就 是 一 组 
数据 。 飞 机 和 舰 船 没有 任何 区 别 。 未 来 的 后 勤 能 力主 要 是 对 机 器 的 能 
源 进行 供给 和 补充 。 


战役 的 机 霹 参谋 部 


指挥 像 诺曼底 登陆 这 样 的 大 型 战役 要 处 理 的 信息 无 穷 多 ， 同 时 要 
面 对 各 方面 的 不 确定 性 ， 即 使 一 个 天 才 军 事 指挥 官 也 不 可 能 处 理 如 此 
巨 量 的 信息 ， 所 以 在 传统 战争 中 侦 然 性 巨大 。 在 未 来 战争 中 ， 一 场 战 
役 已 经 在 计算 机 中 模拟 了 许多 志 。 变 量 越 多 ， 不 确定 性 越 强 ， 机 器 学 
习 算法 就 越 得 心 应 手 。 当 然 最 后 还 是 要 指挥 官 做 决定 ， 但 传统 的 参谋 
部 的 工作 许多 会 被 机 器 取代 。 正 如 机 器 能 局 得 了 围棋 世界 冠军 ， 谁 的 
机 器 参谋 部 算法 更 聪明 ， 谁 赢得 战争 的 机 会 就 大 。 


未 来 最 大 的 挑战 不 仅 是 谁 能 开发 出 最 先进 的 人 工 乔 能 武器 ， 也 是 
谁 能 通过 实战 数据 的 快速 达 代 训练 出 最 佳 模型 ， 更 古 谁 能 最 和 完 在 实战 
中 演化 出 最 佳 的 人 -机 混成 。 而 且 这 种 混成 比例 和 结构 会 随 着 机 器 能 
的 提高 一 直 改 变 。 人 工 乔 能 将 再 一 次 改变 战争 的 形态 ， 这 个 新 形态 不 
以 消灭 肉体 为 主 ， 而 是 以 机 需 之 间 的 搏斗 为 主 ， 这 对 人 类 来 说 越 来 越 
像 一 场 狂热 的 足球 赛 。 和 体育 比赛 不 同 的 是 只 要 机 器 人 败 了 ， 活 人 就 
入 秘 投降 。 


AI 武 器 的 伦理 


目前 国际 法 对 人 工 智 能 武器 没有 任何 具体 规定 ， 国 际 社会 也 没有 
明确 支持 限制 或 禁止 此 类 武器 系统 的 和 条约。 学界 对 此 也 争议 不 断 ， 许 
多 重量 级 科学 家 反对 人 工 智 能 武器 化 。2015 年 ， 包 括 马 斯 友和 霍金 在 
内 的 1 000 多 名 人 工 智能 专家 签署 了 一 封 公 开 信 ， 呼 吁 禁止 自主 化 武 
器 ， 他 们 甚至 称 完 全 人 工 智 能 的 发 展 可 能 招致 人 类 历史 的 终结 。2018 
年 谷歌 公司 仅仅 因为 向 美国 盏 方 的 一 个 项 目 Maven 提 供 了 TensorFlow 的 
接口 ， 就 有 近 4 000 名 谷歌 员工 联合 签名 请 愿 公司 不 要 和 军 方 合 作 ， 因 
为 这 个 项 目的 目标 是 为 军 方 提供 先进 的 计算 机 视觉 ， 能 够 自动 检测 和 
识别 无 人 摄像 机 捕获 的 38 种 物体 ， 甚 至 有 十 几 名 员工 因此 要 辞职 。 国 
际 机 器 人 武器 控制 委员 会 (ICRAC) 也 发 布 一 封 联名 公开 信 ， 超 过 300 
位 人 工 智 能 、 伦 理学 和 计算 机 科学 的 学 者 公开 呼吁 谷歌 结束 该 项 目的 
工作 ， 并 支持 禁止 自主 武器 系统 的 国际 条 约 。 


自主 化 武器 很 可 能 加 剧 全 球 军 备 竞 赛 。2016 年 美国 国防 部 发 表 新 
报告 表示 ， 美 国 需要 “立即 采取 行动 ”加 速 AI 战争 科技 的 开发 工作 ， 
未 来 AI 战 争 不 可 避免 ， 建 议 五 角 大 楼 在 这 方面 加 强 发 展 ， 否 则 会 被 潜 
在 的 敌人 超越 。2017 年 7 月 ， 中 国 推出 了 《新 一 代 人 工 智 能 发 展 规 
划 》， 该 规划 将 人 工 智 能 指定 为 未 来 经 济 和 军事 力量 的 转型 技术 。 它 
的 目标 是 ， 到 2030 年 ， 中 国 将 利用 “军民 融合 ”战略 成 为 人 工 智 能 领 


域 的 续 越 力量 。2017 年 9 月 ， 普 系 对 刚 开 学 的 俄罗斯 孩子 说 : “人 工 智 
能 就 是 未 来 ， 不 仪 对 俄罗斯 而 言 ， 更 是 对 整个 的 人 类 社会 。 谁 成 为 这 
个 领域 的 领导 者 ， 谁 束 将 成 为 世界 的 统治 者 。” 己 斯克 在 推 符 上 回应 
道 : “在 国家 层面 上 人 工 智 能 优势 的 竞争 是 最 可 能 导致 第 三 次 世界 大 
战 的 原因 。” 这 种 军备 竞赛 可 能 会 使 国际 局 面 特别 不 稳定 ， 除 了 几 个 
超级 大 国 ， 其 他 国家 也 会 效仿 。 


人 工 智 能 很 可 能 将 加 速 全 球 军事 力量 不 对 等 和 战争 的 及 生 。 拥 有 
人 工 乔 能 技术 、 战 争 经 历 和 战争 数据 的 国家 能 够 让 上 自主 化 武器 迭代 速 
度 更 快 。 目 前 ， 美 国 、 俄 罗斯 、 以 色 列 等 国家 拥有 较 多 战争 的 文字 、 
视频 记录 。 通 过 监控 臣 师 组 织 、 社 交 媒 体 、 其 他 国家 行动 的 数据 ， 并 
把 这 些 数 据 喂 给 人 工 知 能 让 它们 快速 升级 。 另 外 ， 目 主 化 武器 更 易 流 
通 和 被 滥用 ， 或 被 其 他 国家 和 怒 怖 分 子 获 得 。 即 使 达成 了 禁止 军事 机 
名 人 的 协议 ， 目 主 化 武器 技术 也 非 第 易于 转让 ， 并 将 普及 开 来 。 力 
外 ， 因 为 该 类 武 占 能 够 将 人 员 伤 亡 降 到 最 低 ， 所 以 政客 及 动 战争 的 阻 
碍 因素 又 减少 了 一 项 ， 毕 竟 美 国 等 地 民众 对 战争 造成 士兵 牺牲 的 抗议 
比 战争 花费 更 让 政府 头疼 。 


自主 化 武器 失控 和 错 判 的 风险 将 一 二 存在 ， 比 如 软件 代码 错误 ， 
或 者 受到 网 络 攻击 。 这 可 能 导致 机 器 失灵 或 攻击 目 己 人 ， 或 由 于 系统 
升级 太 快 ， 人 类 伙伴 无 法 及 时 啊 应 。 很 难 对 上 自动 化 武器 的 可 徘 性 进行 
测试 ， 会 思考 的 机 口 的 行事 方式 也 可 能 会 超出 人 类 控制 者 的 想象 。 无 
论 是 在 人 机 交互 的 回路 之 内 (人 类 不 间断 监控 操作 ， 并 保有 关键 决策 
的 负责 人 ) ， 还 是 在 回路 之 上 《人 类 监督 机 器 ， 并 可 以 在 任务 的 任何 
阶段 干预 机 器 ) 或 者 跳出 回路 《机 器 执行 任务 时 没有 人 员 干 预 ) ， 人 
们 应 该 如 何 与 不 同 程 度 的 自主 机 器 交互 仍然 有 竺 研究。 西方 军事 机 构 
坚持 认为 ， 人 类 必须 始终 处 于 人 机 交互 的 回路 之 中 。 但 是 看 到 了 完全 
目 主 系统 所 融 来 的 军事 优势 ， 不 是 每 个 国家 都 会 这 么 审慎。 


群体 学 习 和 光速 分 且 


一 个 很 有 意思 的 例子 是 谷歌 天 于 机 械 手 学 习 的 实验 。 如 图 6. 12 所 
示 ， 在 盘子 里 放 一 些 各 种 形状 的 物体 ， 预 先 没 有 任何 编程 指令 ， 让 机 
械 手 通过 上 方 的 摄像 头 自 己 摸索 着 把 每 个 物体 从 盘子 里 拿 出 来 。 可 以 
想象 ， 这 个 学 习 过 程 需要 很 长 时 间 ， 因 为 一 开始 机 械 手 在 空中 乱 抓 ， 
直到 蒙 对 了 一 个 的 时 候 它 才能 找 对 地 方 ， 然 后 又 要 学 会 抓 取 不 同形 状 
的 物体 。 更 复杂 的 是 一 个 物体 紧 摊 看 故 一 个 物体 ， 机 械 手 必须 学 会 先 
把 边 上 的 物体 挪 开 。 这 台 机 器 学 习 大 约 需 要 80 万 次 的 摸索 ， 如 果 每 10 
秒 抓 取 一 次 ， 那 么 一 合 机 需要 24 小 时 不 停 地 学 习 100 天 。 


单 目 彩色 摄像 头 


7 目 由 度 机 械 手 


图 6.12 机 械 手 学 习 从 盘子 中 抓 取 不 同 的 物体 


图 片 来 源 : https://spectrum. ieee. org/automaton/robotics/artificial- 
intelligence/google-largescale-robotic-grasping-project。 


但 当 谷 歌 让 14 台 机 器 一 起 学 习 的 时 候 ， 学 习 的 时 间 惑 缩短 到 了 
100/14=7 天 。 这 14 台 机 需 都 互相 联网 ， 当 一 台 机 需 找 对 地 方 或 学 会 了 
一 个 技能 时 ， 其 他 所 有 的 机 器 瞬间 都 学 会 了 。 这 种 机 器 之 间 的 交流 不 
仅 是 无 障碍 的 而 且 是 以 光速 进行 的 。〈 如 图 6. 13 ) 


图 6.13 谷 歌 的 14 台 互相 联网 的 机 械 手 同时 学 习 抓 取 物 体 


图 片 来 源 : https://spectrum. ieee. org/automaton/robotics/artificial- 
intelligence/google-largescale-robotic-grasping-project。 


人 类 的 知识 传播 阻力 重重 ， 有 成 本 问题 ， 有 利益 问题 ， 还 有 和 学习 
， 未 来 机 器 之 间 的 群体 学 习 、 无 私 共计 和 光速 传播 
会 带 来 不 可 思议 的 奇迹 。 我 们 今天 可 以 想象 的 奇迹 有 以 下 几 方 


(1) 机 器 可 以 在 极 短 的 时 间 内 掌握 极 难 的 技能 。 例 如 获 驶 飞机 通 
常 需 要 几 百 小 时 的 飞行 训练 ， 战 斗 机 需要 更 长 的 时 间 ， 如 果 是 1 万 个 机 


器 模型 用 不 同 的 数据 一 起 学 习 ， 可 能 一 秒 就 能 达到 王牌 飞行 员 的 水 
| 

(2) 数 年 内 让 几 和 万 人 失业 。 有 目前 硅谷 Vicarious 公 司 在 开发 机 
械 手 的 通用 软件 ， 可 以 安装 在 任何 类 型 的 机 械 手 上 来 取代 目前 各 种 加 
工 、 筛 选 、 检 测 、 物 流 中 的 人 力 。 一 旦 这 种 类 型 的 软件 成 熟 ， 取 代 人 
工 的 成 本 就 是 一 些 塑 料 和 齿轮 加 上 几 个 已 片 。 

(3) 超级 规模 的 协同 行动 。 协 调 人 类 的 大 规模 行动 很 难 ， 例 如 让 
分 布 在 世界 各 个 国家 的 100 万 人 在 同一 个 时 间 唱 同一 首 歌 就 是 一 个 几乎 
无 法 完成 的 任务 ， 但 是 让 100 万 人 台 机 器 同时 跳 一 文 舞 却 很 容易 。 人 类 最 
大 规模 的 协同 行动 通常 是 战争 ， 未 来 的 战争 可 能 是 天 空中 突然 出 现 几 
万 架 无 人 机 ， 战 斗 在 几 秒 内 结 

(4) 通用 机 器 人 智力 增长 惊人 。 如 果 未 来 能 够 有 通用 机 器 人 ， 让 
散布 在 世界 各 地 的 从 事 各 种 工作 的 机 器 人 的 大 脑 相 互联 结 ， 你 束 会 惊 
奇 地 发 现 它 们 每 分 钟 都 在 学 会 新 的 东西 。 从 新 生 儿 到 成 人 的 几 十 年 的 
学 习 会 压缩 到 几 分 钟 甚 至 几 秒 。 一 台新 机 器 人 刚 接 通电 源 就 会 变 成 读 
过 万 卷 书 、 行 过 万 里 路 的 “ 老 江 湖 ”。 


人 类 哪里 比 机 器 强 


看 完 上 面 的 讨论 读者 可 能 非常 郁 癌 ， 难 道 我 们 人 类 就 没有 比 机 器 
强 的 地 方 了 吗 ? 撤 开 情感 ， 如 果 只 讨论 智力 和 智能 ， 人 比 机 器 强 在 哪 
里 ?这 个 问题 要 分 成 两 个 部 分 来 谈 ， 一 是 目前 人 比 机 器 强 在 哪里 ? 二 
是 人 可 能 永远 比 机 器 强 在 哪里 ? 

和 目前 的 神经 网 络 相 比 ， 人 类 在 认 知 方面 比 机 器 强 在 以 下 几 个 方 
面 。 


(1) 学 习 识别 物体 不 需要 大 数据 。 机 器 要 认识 一 只 猫 也 许 要 几 万 
张 图 片 ， 图 片 的 颜色 或 构图 稍微 变化 一 下 或 者 有 遮挡 、 残 僻 ， 机 器 就 
不 行 了 。 而 人 类 能 够 从 小 数据 中 迅速 提炼 归纳 出 规律 ， 一 个 女儿 可 以 
看 见 一 只 猫 后 就 认识 了 所 有 的 猫 。 也 许 正如 莫 桑 维 克 悖 论 所 阔 述 的 ， 
高 级 推理 所 需要 的 计算 量 不 大 ， 反 倒是 低级 的 感觉 运动 技能 需要 庞大 
的 计算 资源 。 

(2) 机 器 没有 常识 和 物理 世界 的 模型 。 人 类 在 一 个 陌生 环境 摸索 
一 阵 后 ， 能 很 快 在 大 脑 中 建立 起 模型 来 。 

(3) 机 器 没有 自主 和 自发 的 通用 语言 能 力 〈 目 前 人 类 输入 的 语法 
规则 或 通过 数据 训练 出 来 的 “语言 ”能 力 只 能 处 理 限定 场景 ， 否 则 就 
能 通过 图 灵 测 试 了 ) 。 

(4) 机 器 没有 想象 力 ( 需 要 大 量 常识 ， 反 事实 假设 及 推理 能 
ys 

(5) 机 器 没有 自我 意识 。 

(6) 机 器 没有 情感 和 同 理 心 。 

总 体 来 说 ， 基 于 神经 网 络 的 机 器 学 习 的 主要 功能 是 记忆 和 识别 ， 
其 他 一 切 能 力 都 是 建立 在 这 个 基础 上 的 。 基 于 神经 网 络 的 机 器 大 脑 更 
像 一 个 低 等 动物 的 大 脑 ， 只 具有 对 外 界 的 反应 能 力 ， 虽 然 这 种 反应 能 
力 的 精密 和 复杂 程度 远 超人 类 和 其 他 动物 。 

如 果 未 来 人 工 智能 的 基础 还 是 神经 网 络 ， 随 着 训练 数据 集 的 增 大 
和 处 理 能 力 的 增强 ， 上 面 的 〈1) 就 会 得 到 改善 甚至 可 以 达到 人 类 的 水 
平 。 其 中 2》 也 有 可 能 用 穷尽 法 解决 。 但 是 很 难 想象 机 器 会 具有 通用 
语言 能 力 、 想 象 力 ， 更 谈 不 上 自我 意识 。 

简单 地 说 ， 虽 然 基于 神经 网 络 的 人 工 智能 在 记忆 和 识别 这 两 个 基 
础 智能 方面 超过 了 人 ， 但 在 推理 、 想 象 等 高 级 智能 方面 还 和 人 相去 其 
远 。 未 来 最 佳 的 结合 就 是 人 类 和 机 器 合作 ， 互 相 取长补短 。 


人 机 融合 


人 类 和 机 器 该 如 何 合 作 ? 脑 机 接口 (BMI: brain-computer 
interface) 是 科学 家 研究 的 一 个 重要 方向 ， 指 创建 在 人 类 或 动物 大 脑 
与 外 部 设备 之 间 的 直接 连接 通路 。 被 脑 机 接口 串联 的 人 脑 能 够 与 外 部 
设备 之 间 互 相传 送信 号 ， 交 换 信 息 。 可 以 预料 ， 当 这 项 技术 发 展 到 一 
定 的 程度 ， 人 们 就 能 够 通过 “外 挂 ” 外 部 设备 的 方式 ， 来 提高 生物 体 
脑 部 的 感知 、 运 算 等 能 力 ， 以 及 通过 脑 电 波 更 为 直接 地 对 外 部 机 器 下 
达 命 令 ， 或 与 其 他 人 类 进行 协同 。 

最 激进 的 方法 之 一 就 是 马 斯 元 提出 的 Neuralink， 研 发 出 一 种 “ 神 
经 荔 丝 ”对 接 在 人 脑 的 神经 网 络 上 ， 直 接 接 收入 脑 的 信号 。 马 斯 克 认 
为 机 器 “思维 ”和 输入 输出 都 非常 快 ， 而 人 类 通过 语言 或 键盘 的 输入 
输出 比 机 器 慢 好 几 个 数量 级 ， 这 将 是 人 类 和 机 器 相 比 最 大 的 和 劣势。 不 
打破 这 个 瓶颈 ， 人 类 总 有 一 天 会 受制 于 机 器 。Neuralink 要 解决 的 是 突 
破 人 类 的 信号 输入 和 输出 瓶颈 ， 但 他 的 想法 有 一 个 基本 漏洞 : 人 类 的 
高 级 思维 必须 依赖 语言 。 如 果 脱 离 了 语言 我 们 就 完全 无 法 进行 高 级 思 
维 〈 如 逻辑 推 理 、 描 述 场景 等 ) 。 如 前 所 述 ， 目 前 的 基于 神经 网 络 的 
机 器 学 习 能 力主 要 是 对 环境 的 识别 能 力 ， 还 没有 升华 到 语言 和 逻辑 推 
理 。 而 人 类 只 能 通过 语言 进行 沟通 。 这 也 是 我 们 在 前 文 所 说 的 ， 人 类 
的 “明知 识 ” 无 法 和 机 器 的 “上 暗 知 识 ” 沟 通 。 

在 硅谷 ， 男 一 位 成 功 的 企业 家 布 莱 因 ，。 约 鞭 逊 (Bryan Johnson) 
也 成 立 了 一 家 公司 叫 Kernel， 宣 称 要 能 够 对 神经 网 络 的 底层 功能 直接 
读 和 写 ， 他 号 称 要 投入 一 亿美 元 来 打造 这 个 技术 。Kerne1 和 Neuralink 
当前 的 主要 目的 是 让 这 些 机 器 和 人 脑 一 起 工作 ， 当 这 些 设 备用 于 治疗 
脑 部 疾病 时 ， 设 备 不 光 回 大 脑 发 送信 号 以 便 作 为 治疗 的 手段 ， 也 会 收 
集 这 些 病症 的 特征 数据 。 正 如 约翰 进 所 说 的 ， 这 些 设 备 可 以 采集 到 关 
于 人 脑 工 作 原 理 的 大 量 数 据 ， 从 而 反哺 所 有 神经 科学 的 研究 领域 。 约 


朝 进 认为 ， 如 果 我 们 拥有 来 自 大 脑 更 多 区 域 、 更 高 质量 的 神经 数据 ， 
那么 它 能 为 神经 科学 的 研究 带 来 更 多 可 能 性 ， 只 是 我 们 目前 还 没有 合 
适 的 工具 去 获知 这 些 数据 。 但 Kerne1 公 司 的 技术 顾问 ， 斯 坦 福 大 学 神 
经 科学 家 大 卫 。 伊 格 曼 (David Eagleman) 教授 认为 在 一 个 健康 人 的 
脑 中 动手 术 植 入 一 个 电脑 接口 根本 不 可 能 。 先 不 说 死亡 、 感 染 、 免 疫 
排斥 等 危险 ， 连 往 哪 接 目 前 都 不 知道 。 脑 神经 科 的 医生 动 开 颅 手术 和 
脑 神经 手术 都 是 在 万 不 得 已 的 情况 下 ， 例 如 患者 的 大 脑 有 严重 疾病 或 
损伤 。 伊 格 曼 认为 更 有 可 能 的 情况 是 ， 科 学 家 会 发 现 更 好 的 从 外 部 读 
取 和 模拟 大 脑 的 方法 。 今 天 ， 医 生 通 过 功能 性 核磁 共振 成 像 仪 
(FMRI) 等 技术 读 取 大 脑 的 信息 ， 并 通过 经 据 磁 刺激 等 方法 改变 其 行 
为 ， 但 这 些 仍然 是 较为 简单 的 技术 。 伊 格 受 认为 ， 如 果 科 学 家 能 够 对 
人 脑 有 更 好 的 了 解 ， 那 么 他 们 可 以 大 幅 改 进 这 些 方法 ， 或 基于 它们 而 
发 明 更 有 用 的 方法 。 例 如 ， 科 学 家 可 以 通过 基因 技术 去 改变 神经 元 ， 
从 而 使 机 器 可 以 从 体外 对 神经 元 进行 “ 读 写 ”， 或 者 也 可 以 通过 “ 吞 
服 ” 纳 米 机 器 人 实现 同样 的 目的 ， 所 有 这 些 方法 都 比 植 入 神经 网 络 靠 


谱 。 


其 实 马 斯 元 并 非 第 一 个 提出 这 个 设想 的 人 ， 这 方面 的 研究 历史 至 
少 有 100 年 之 久 ， 商 业 化 的 努力 也 一 直 前 赴 后 继 。 外 科 医 生 已 经 能 够 把 
某 些 设 备 移植 到 人 体内 ， 脑 神经 科 的 手术 目前 主要 是 植 入 深度 神经 刺 
激 信 号 ， 用 来 治疗 预 病 、 由 金 称 病 等 ， 重 建 患 者 的 视觉 、 运 动 等 能 
力 。 例 如 通过 植 入 电极 来 抑制 癫 病 发 病 时 的 神经 脑 电信 号 ， 在 这 些 情 
况 下 ， 冒 一 些 风 险 是 值得 的 。IBM 的 科学 家 在 开发 一 个 类 似 的 项 目 ， 通 
过 分 析 在 疾病 发 作 时 的 大 脑 信号 ， 做 出 可 植 入 人 体 并 能 抑制 预 病 发 作 
的 仪器 。〔( 见 图 6. 14) 


图 6.14 用 于 治疗 疗 冯 的 RN 系统 装备 
图 片 来 源 : IBM Treat epilepsy with RNS 。 


目前 主要 的 成 功 案例 来 自 一 名 叫 作 威廉 姆 。 多 贝尔 (William 


Dobelle) 的 科学 家 。1978 年 ， 多 贝尔 在 一 位 盲人 的 脑 内 植 入 了 由 68 个 
电极 组 成 的 阵列 ， 这 种 党 试 合 盲人 产生 了 光 约 视 〈 视 网 膜 受 到 刺激 时 
产生 的 感觉 ) 。 在 随后 的 调试 中 ， 接 受 这 种 治疗 的 盲人 能 够 在 有 限 的 
视野 内 看 到 低 分 辩 率 、 低 刷新 率 的 点 阵 图 像 。2002 年 ， 接 受 新 一 代 系 
统治 疗 的 患者 恢复 了 更 多 的 视力 ， 甚 至 可 以 在 研究 中 心 附 近 和 驾车 慢 速 
前 行 。 同 一 阶段 ， 在 恢复 运动 功能 方面 ， 脑 机 接口 研究 也 取得 了 显著 
的 进展 。( 见 图 6. 15) 


图 6.15 双 目 失明 的 延 斯 在 仿生 眼 的 帮助 下 得 到 了 一 定 程度 的 视力 
图 片 来 源 : jensnaumann. green-fi rst. com。 
刚才 提 到 除了 植 入 电极 还 有 一 种 可 能 的 方法 是 在 头 上 戴 一 个 “ 电 
极 暑 ”， 采 用 “黑箱 ”方法 解读 人 脑 。 只 要 单 在 头 上 的 电极 单 能 够 从 


大 脑 中 稳定 地 检测 到 足够 复杂 的 信号 ， 用 此 时 人 的 语言 或 动作 作为 输 
出 ， 通 过 机 器 学 习 的 方法 建立 输入 《检测 到 的 脑 电信 号 ) 和 输出 〈 语 
言 或 动作 ) 的 一 一 对 应 。 这 里 的 假设 是 对 应 每 一 个 输出 的 输入 都 是 相 
同 或 类 似 〈 例 如 每 次 竖 大 拇指 的 脑 电 波 都 相同 〉 的 且 能 稳定 地 检测 这 
些 信号 。 这 种 方式 没有 在 大 脑 内 植 入 电极 ， 信 号 没有 那么 清晰 ， 数 据 
量 没 有 那么 大 ， 也 没有 那么 稳定 ， 受 到 的 干扰 也 会 更 强 一 些 。 


虽然 通过 头 戴 式 装 备 获取 微弱 的 脑 电波 信号 的 方式 难度 很 大 ， 但 
是 经 过 几 十 年 的 发 展 ， 科 学 家 已 经 开始 取得 突破 ， 尤 其 是 在 残疾 人 部 
分 能 力 的 重建 上 。1988 年 ， 美 国 科 学 家 已 经 实现 了 用 大 脑 控 制 虚 拟 打 
字 机 的 操作 ， 瑞 典 科 学 家 更 是 实现 了 轮椅 按 人 脑 意 识 控制 前 进 。2006 
年 ， 日 本 研制 出 “混合 辅助 腿 ”， 能 够 帮助 残疾 人 以 每 小 时 4 千 米 的 速 
度 行走 。 在 2014 年 世界 标 上 ， 身 患 截瘫 的 巴西 青年 朱 利 亚 话 。 平 托 身 
穿 一 套 奇怪 的 “机 械 战 甲 ”， 在 工作 人 员 的 帮助 下 开 出 了 世界 杯 的 第 
一 脚 球 ， 这 缘 后 就 是 使 用 脑 机 接口 技术 + 外 骨骼 成 功 让 一 个 瘫痪 患者 恢 
复 了 行动 能 力 。 ( 见 图 6. 16) 

另外 ， 该 类 技术 已 经 能 够 实现 远程 控制 机 器 、 玩 游戏 等 。2008 年 1 
月 ， 杜 克 大 学 的 研究 团队 让 身 在 美国 达 勒 姆 实验 室 的 猴子 用 意识 控制 
了 远 在 日 本 京都 实验 室内 机 器 人 的 行走 。2013 年 3 月 ， 英 国 研究 人 员 开 
发 出 第 一 种 用 于 控制 飞船 模拟 器 的 “ 脑 机 接口 ”装置 ， 美 国 科学 家 又 
创建 了 计算 机 模拟 程序 ， 戴 在 头 上 后 通过 人 脑 的 意念 便 可 以 控制 飞船 
模拟 飞行 。2017 年 10 月 ， 美 国 亚利桑那 州立 大 学 以 人 为 导向 机 器 人 和 
控制 实验 室 的 负 贡 人 Panagiotis Artemiadis 宣 布 正 在 研发 一 种 导航 系 
统 ， 能 够 让 驾驶 员 只 借助 自己 的 思维 同时 操控 一 群 无 人 机 。 


图 6.16 为 巴西 世界 杯 开 球 的 志愿 者 朱 利 亚 诺 - 平 托 


图 片 来 源 : 
http://hiphotos. baidu. com/feed/pic/item/f603918fa0ec08fab12d60f453ee3d6d5 
5f bdab0. jpg。 


脑 机 接口 技术 的 意义 在 于 能 够 让 人 的 大 脑 能 力 获 得 提升 ， 或 实现 
能 力 重 建 ， 甚 至 是 实现 远程 控制 。 本 质 上 普通 人 只 能 用 目 己 的 意识 来 
控制 自己 的 号 体 ， 而 脑 机 技术 能 够 让 人 类 实现 通过 意识 操控 远 在 千里 
之 外 的 机 器 人 ， 更 重要 的 是 ， 通 过 机 器 人 《及 体 ) 的 传 感 顺 ， 这 些 感 
党 可 以 实时 传 回 到 人 类 的 大 脑 一 一 在 茶 种 程度 上 人 类 已 经 实现 了 肉体 
的 无 限 延 伸 和 空间 的 穿越 ， 这 已 经 粘 履 了 人 类 的 认 知 。 脑 机 接口 的 远 
程控 制 有 望 在 诺 多 领域 实现 应 用 ， 例 如 智 意 机 器 人 去 危 辽 的 火灾 、 电 
力 、 搜 救 等 领域 工作 ， 同 样 也 可 以 在 地 质 勘 探 、 农 业 、 物 流 等 领域 实 
现 应 用 。 


通过 连接 到 云端 所 升 语言 能 力 


谷歌 技术 总 监 库 效 韦 尔 〈Kurzweil) 认为， 由 于 智能 手机 能 提供 
海量 的 计算 和 数据 ， 所 以 它 已 经 让 我 们 远 远 比 20 年 前 的 人 聪明 。 有 朝 
一 日 ， 我 们 不 青 需 要 手持 设备 ， 通 过 植 入 大 脑 皮质 的 芯片 就 可 以 让 我 
们 连接 到 云端 。 我 们 可 以 通过 与 人 工 智能 结合 而 变 得 更 加 智能 ， 通 过 
更 多 潜在 的 方式 去 共享 语言 (例如 能 立刻 接 入 英语 词典 ) 。 库 效 韦 尔 
认为 这 些 和 我 们 现在 的 习惯 差别 不 大 ， 只 是 用 大 脑 中 的 芯片 蔡 代 了 翻 
译 。 


馆 者 66 还 魂 23 


通过 给 人 工 乔 能 系统 灌输 某 个 人 的 照片、 视频 、 音 频 、 信 件 、 日 
记 、 邮 件 、 账 单 以 及 任何 能 表现 他 个 性 的 东西 ， 可 以 造 出 挝 者 的 “化 
喘 ”， 我 们 戴 上 头 备 就 可 以 在 虚拟 世界 和 他 交流 互 动 。 库 效 韦 尔 表示 
他 已 经 造 出 了 他 过 世 多 年 的 父亲 的 “化 遇 ”， 他 认为 这 是 一 个 将 父 羔 
带 回 杀人 身边 的 方式 ， 虽 然 目前 把 挝 者 带 回 人 工 智能 世界 还 不 完全 真 
实 ， 但 以 后 会 更 加 接近 。 


第 七 草 


“ 神 人 ”与 “ 朵 人 ”一 一 AI 时 代 的 社会 与 


Al 带 来 的 变化 绝 不 只 是 在 商业 和 科技 领域 ， 而 是 和 互联 网 一 


样 会 冲击 今天 的 社会 结构 甚至 道德 伦 理 ， 每 一 个 在 社会 中 生活 的 
人 都 会 受到 影响 。 即 使 没有 读 前 面 的 章节 ， 也 可 以 直接 读 这 一 


让- 


蕴 。 


AI 机 需 的 崛起 会 不 会 导致 大 规模 失业 ? 运 今 为 止 ， 历 史上 大 的 技 
术 突 破 并 没有 对 人 类 的 工作 产生 毁灭 性 的 打击 。 藻 汽机 的 诞生 丛 代 了 
传统 的 又 马 ， 印 刷机 的 诞生 取代 了 传统 的 抄写 员 ， 农 业 目 动 化 设施 的 
产生 符 代 了 很 多 农民 的 工作 ， 但 这 都 没有 致使 大 量 的 人 流离 失 所 。 相 
反 ， 人 们 找到 了 更 适合 人 类 的 工作 。 


但 这 次 还 会 一 样 吗 ? 随 着 智能 机 器 的 崛起 ， 大 量 重 复 性 苑 动 将 被 
耸 代 。 在 这 个 社会 中 ， 人 类 能 够 在 技术 帮助 下 做 更 多 的 事情 ， 从 而 更 
多 负责 创造 新 事物 。 但 如 何 保证 原 有 重复 性 苑 动 者 能 够 稳步 过 渡 到 新 
工作 ， 将 成 为 一 项 挑战 ， 毕 竟 这 次 变革 的 冲击 将 超过 历史 上 的 任何 一 
次 变革 。 各 国政 府 都 在 未 雨 绸 纱 应 对 可 能 会 出 现 的 贫 富 分 化 加 速 。 


《未 来 简 史 》 一 书 的 作者 尤 瓦 尔 。 赫 拉 利 〈Yuval Harari) 曾 预 
测 ， 若 干 年 后 ， 人 类 社会 最 大 的 问题 是 人 工 智 能 带 来 一 大 批 “无 用 的 
人 类 ”; 同时 ， 也 会 催生 出 “超人 类 ” (Superhuman) 。 他 认为 ， 一 
小 部 分 超人 类 将 可 以 借助 科学 技术 不 断 地 “更 新 ”自身 ， 操 控 基 因 ， 
甚至 实现 人 脑 与 计算 机 互联 ， 获 得 一 种 不 死 的 状态 。“ 在 以 前 的 历史 
上 ， 贫 富 差距 只 是 体现 在 财富 和 权力 上 ， 而 不 是 生物 学 上 上， 帝王 和 农 
民 的 映 体 构造 是 一 样 的 。 在 人 可 以 变 成 超人 类 后 ， 传 统 的 人 性 就 不 存 
在 了 ， 人 类 会 分 化 为 在 体能 和 智能 上 都 占据 绝对 优势 的 超人 阶层 和 成 
二 上 万 普通 的 无 用 的 人 类 。 ”他 的 担心 会 成 为 现实 吗 ? 


机 器 酿 成 的 事故 由 谁 负责 ? 自主 化 武器 、 无 人 驾驶 汽车 、 生 产 机 
器 人 等 都 可 能 因为 代码 错误 或 在 环境 巨变 下 失控 酿 成 灾难 。 随 着 智能 
产品 的 逐渐 普及 ， 我 们 对 它们 的 依赖 也 越 来 越 深 。 当 机 器 遇 到 困难 
时 ， 往 往 会 将 操控 权 转 交 给 人 类 ， 而 人 类 很 难 瞬 间接 管 好 一 项 突然 转 
来 的 工作 。 比 如 入 类 接管 无 人 车 驾驶 时 可 能 因为 睡 着 了 或 注意 力 不 集 
中 而 发 生 事故 ， 这 种 事故 在 人 类 和 机 器 之 间 也 很 难 悍 清 责任 。 

在 未 来 的 战争 中 ， 军 方 为 了 减少 已 方 伤亡 将 尽 可 能 用 自主 化 武器 
代替 人 进行 军事 活动 。 自 主 化 武器 将 让 后 台 操纵 人 员 不 用 对 每 个 具体 
结果 负责 任 。 而 且 随 着 自主 化 武器 任务 的 日 益 复 杂 ， 后 台 操纵 人 员 也 
越 来 越 多 ， 每 个 人 只 是 完成 一 个 任务 的 一 小 部 分 。 这 使 人 们 对 这 种 
“ 杀 台 ” 变 得 心安 理 得 。 


谁 先 失 业 


牛津 大 学 的 一 份 研究 报告 指出 下 列 职业 将 是 最 先 被 人 工 智 能 取代 
的 ， 在 2033 年 下 列 职业 被 AI 取代 的 概率 如 下 : 


(1) 电话 营销 员 ，99%。 


(2) 收银 员 ，97%。 

(3) 快餐 厨师 ，96%。 

(4) 律师 助手 ，94%。 

(5) 导游 ，91%。 

(6) 公交 车 和 出 租车 司机 ，89%。 
(7) 安保 人 员 ，84%。 

(8) 档案 管理 员 ，76%。 


将 被 AI 取 代 的 工作 和 职业 远 不 止 这 些 。 麦 肯 锡 发 表 的 一 份 研 究 报 
告 指出 ， 中 国 的 劳动 力 可 以 被 自动 化 的 程度 比 世 界 上 任何 其 他 国家 都 
要 高 。 据 该 报告 估计 ，20 年 内 中 国 51% 的 工作 可 以 自动 化 ， 相 当 于 3. 94 
亿 全 职员 工 。 最 容易 被 AI 取代 的 是 那些 重复 性 高 、 可 预测 、 可 编程 的 
工作 。19 世 纪 的 机 器 主要 代替 体力 工作 者 ， 这 次 AI 将 蔡 代 许多 脑力 工 
作者 。 中 等 技能 的 专业 人 员 可 能 首当其冲 ， 而 目前 很 难 程序 化 的 工 
作 ， 例 如 保姆 反而 很 难 被 取代 。 许 多 高 技能 、 高 收入 的 职业 也 可 能 受 
到 冲击 。 这 种 冲击 体现 在 两 个 方面 : 一 是 直接 取代 ， 例 如 中 级 X 光 读 片 
医生 和 律师 事务 所 的 文书 ， 二 是 增强 ， 例 如 医生 的 AI 辅助 诊断 。 许 多 
任务 可 能 会 目 动 化 或 大 大 缩短 时 间 ， 有 些 工 作 可 能 会 发 生 改 变 。 正 如 
电脑 出 现 后 并 没有 消灭 会 计 ， 而 是 让 会 计 更 高 效 ， 能 分 析 过 去 无 法 分 
析 的 大 量 数据 ， 能 产生 过 去 无 法 产生 的 大 量 图 形 和 表格 。AI 对 许多 行 
业 的 影响 也 将 类 似 。 

同样 的 道理 ， 那 些 很 难 标准 化 、 程 序 化 的 工作 将 是 最 难 被 AI 取代 
的 。 以 下 是 一 部 分 最 难 被 取代 的 工作 ， 它 们 未 来 被 取代 的 概率 如 下 : 


(1) 考古 学 家 ，0. 07%。 
(2) 心理 咨询 和 毒 瘾 治疗 工作 者 ，0. 3%。 
(3) 职业 病理 疗 师 ，0. 35%。 


(4) 营养 师 ，0. 39%。 
(5) 医生 特别 是 外 科 手 术 医 生 ，0. 42%。 
(6) 神职 人 员 ，0. 81%。 


这 上 坚 难以 被 AI 取代 的 职业 的 一 个 特点 是 需要 有 对 人 类 情感 和 精神 
的 理解 。 这 是 目前 的 AI 完全 无 法 做 到 的 。 


孩子 该 学 什么 


目前 AI 工作 市 场 很 热 ， 各 公司 竞相 出 高 薪 吸 引 AI 人 才 ， 特 别 是 高 
级 人 才 。 各 类 培训 班 也 趁机 大 发 其 财 ， 许 多 大 学 生 、 研 究 生 纷纷 选修 
AI 的 课程 。 随 着 进入 这 个 领域 的 人 数 增加 和 AI 计算 能 力 越 来 越 “ 程 序 
化 ”， 预 计 不 出 五 年 普通 的 AI 人 才 就 会 产生 剩余 。 每 当 朋 友 问 到 “我 
的 孩子 要 学 AI 吗 ”， 笔 者 的 回答 都 是 “学 好 数理 化 ， 走 遍 天 下 都 不 
怕 ”。 现 代 科 学 的 全 部 基础 是 2 500 年 前 希腊 的 《几何 原本 》。 但 凡 称 
得 上 科学 的 学 科 一 定 具备 两 个 特点 : 一 是 具备 像 《 几 何 原本 》 那 样 的 
公理 系统 ; 二 是 可 以 用 实验 验证 假设 。 物 理学 是 建立 在 数学 之 上 的 ， 
化 学 又 是 建立 在 物理 学 之 上 的 ， 生 物 学 又 是 建立 在 物理 和 化 学 之 上 
的 。 归 根 结 底 ， 所 有 现代 科学 的 基础 都 是 数学 。 人 工 智能 也 不 例外 ， 
基于 神经 网 络 的 机 器 学 习 的 全 部 数学 基础 就 是 偏 微分 方程 和 线性 代数 
(两 门 大 学 理工 科 的 必修 课 ) ， 人 工 智 能 其 他 流派 可 能 还 要 涉及 概率 
论 〈 大 学 基础 课 ) 和 随机 过 程 ( 大 学 或 研究 生 课 程 》。 今天 的 小 学 
生 、 中 学 生 到 大 学 毕业 时 ， 人 工 智能 不 知 会 发 展 到 什么 程度 ， 但 它 的 
数学 基础 还 将 是 以 上 这 些 课程 。 一 二 十 年 以 后 ， 也 许 基 于 神经 网 络 的 
机 器 学 习 会 遇 到 瓶 颈 ， 但 学 好 数理 化 的 孩子 可 以 有 许多 其 他 选择 ， 而 
不 必 局 限 在 AI 领域 。 


除了 数学 ， 男 外 一 门 最 重要 的 课 就 是 语文 (包括 外 语 ) 。 语 文 培 
养 的 不 仅 是 表达 能 力 ， 更 重要 的 是 塔 养 同 理 心 的 途径 。 人 类 之 间 沟 通 
的 基础 就是 同 理 心 和 共 情 心 ， 即 根据 目 己 的 感觉 理解 别人 的 能 力 。 机 
名 没有 同 理 心 和 共 情 心 ， 未 来 最 难 被 机 器 取代 的 就 是 需要 和 人 类 沟通 
的 工作 。 

在 能 力 方面 ， 除 了 沟通 能 力 以 外 ， 未 来 最 重要 的 是 想象 力 和 创造 
力 ， 而 不 是 “ 工 折 ”能 力 。 


AI 时 代 的 新 工种 


新 监 领 工种 


像 以 往 的 新 技术 一 样 ，AI 将 催生 一 系列 新 的 职业 。 以 下 是 可 以 预 
见 的 新 蓝领 工种 。 


1. 数据 标注 员 


在 AI 视 觉 的 发 展 史 上 ，ImageNet 的 庞大 数据 库 发 挥 了 重要 的 作 
用 。 这 个 数据 库 中 有 上 和 干 万 张 用 人 工 标 注 了 的 图 像 〈 例 如 一 张 狗 的 照 
片上 标注 “德国 牧羊 犬 ”) ，ImageNet 的 创建 者 斯 坦 福 大 学 的 李 飞 飞 
教授 在 网 络 上 动员 了 上 万 人 参与 到 标注 工作 中 来 。 目 前 许多 AI 算法 的 
训练 都 有 赖 于 大 量 的 已 标注 数据 。 许 多 大 公司 例如 谷歌 已 经 开始 雇用 
越 来 越 多 的 人 标注 数据 ， 包 括 图 像 、 视 频 等 。 这 个 工作 需要 多 少 人 
呢 ? 原则 上 讲 要 把 被 识别 的 种 类 的 所 有 情况 都 标注 出 来 ， 机 器 才能 
“全 面 掌握 ”。 例 如 在 自动 驾驶 中 所 有 需要 判断 的 场景 都 需要 标注 出 
来 ， 而 这 些 场景 可 能 无 穷 多 。 


2. 数据 采集 师 


自动 驾驶 要 采集 一 个 国家 所 有 道路 的 精确 地 图 ， 需 要 几 百 辆 数据 
采集 车 常年 采集 。 我 们 的 生产 和 生活 中 有 无 数 这 样 需要 采集 数据 的 工 
作 。 除 了 在 田野 采集 数据 ， 许 多 数据 还 需要 后 台 的 清理 ， 这 些 也 少 不 
站 类 于 的 于 催 


3. AI 训练 师 


许多 AI 算 法 在 正确 识别 场景 之 后 并 不 知道 该 如 何 行 动 ， 这 时 人 类 
可 以 提供 指导 。 例 如 可 以 在 汽车 要 驶 模拟 器 上 随机 产生 千变万化 的 道 
路 场景 ， 由 人 操纵 模拟 器 。 机 器 记录 下 来 场景 和 人 的 相应 动作 。 甚 至 
更 进一步 ，AI 和 驾驶 训练 员 开 着 车 在 北京 拥挤 不 堪 的 交通 中 每 日 罕 行 ， 
车 中 的 传感器 《摄像 头 、 雷 达 等 ) 记录 下 来 各 种 复杂 的 场景 和 相应 的 
驾驶 员 的 动作 。 


在 工厂 生产 线 上 ， 人 类 训练 师 也 可 以 “手把手 ”地 教 机 械 辟 或 机 
船 人 学 会 某 些 特殊 性 的 序列 动作 。 


新 日 领 工种 

最 近 美国 政府 的 一 份 报告 提出 了 未 来 和 AI 有 关 的 相关 工作 ， 分 为 
以 下 四 类 。 

(1) 需要 与 AI 系 统一 起 工作 以 便 完成 复杂 任务 的 参与 工作 例如 
AI 辅助 医疗 诊断 ) 。 


(2) 开发 工作 ， 创 建 AI 技 术 和 应 用 程序 例如 数据 库 科 学 家 和 软 
件 天 友和 内 3 


(3) 监控 或 维修 AI 系统 的 工作 《例如 维护 AI 机 器 人 的 技术 人 
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(4) 啊 应 AI 驱 动 的 范式 转变 的 工作 (例如 律师 围绕 AI 创 建 法 律 框 
如， 或 创建 可 容纳 自动 驾驶 车 辆 的 城市 规划 者 ) 。 


新 粉 领 工种 


机 露 最 难 取代 的 就 是 要 求 高 度 情 感 的 工作 ， 例 如 遇 幼 儿 教 育 ， 社 
会 工作 、 心 理 咨询 等 。 随 着 社会 老龄 化 ， 老 年 人 的 照顾 和 护理 将 成 为 
一 个 巨大 需求 。 目 前 这 个 需求 远 远 无 法 满足 的 原因 在 于 大 部 分 老年 人 
的 支付 能 力 不 足 。 可 以 想象 类 似 美 国 给 低 收 入 人 群 提供 的 食品 券 一 样 
给 老人 提供 “老年 照顾 券 ”【〔 在 手机 上 实现 支付 和 有 反 作 浆 都 很 简 
单 ) ， 且 只 能 把 这 些 券 支付 给 服务 机 构 。 未 来 甚至 会 出 现 “ 定 制 电 话 
从 唤 员 ”“ 家 星 心 理 咨询 师 ” 等 。 这 些 伦 粥 员 和 咨询 师 与 今天 的 电话 
聊天 服务 及 心理 咨询 师 的 最 大 不 同 是 他 们 不 仅 针对 固定 的 客户 群 ， 而 
且 服 务 是 持续 的 。 未 来 甚至 会 出 现 专业 粉丝 团 ， 不 仅 是 为 明星 当 粉 
丝 ， 还 可 以 为 任何 需要 掌声 的 人 当 粉 丝 。 


女性 的 优势 


人 类 “生离死别 ”的 情感 都 源 于 肉体 的 脆弱 和 生命 的 有 限 。 机 器 
没有 这 些 限制 因此 不 具备 这 些 情 感 ， 即 使 机 器 去 模拟 这 些 情 感 也 很 
假 。 女 性 情感 比 男性 丰富 ， 上 所 以 比 男性 更 难 被 机 器 取代 。 机 右 取 代 人 
的 难 易 程度 从 易 到 难 将 是 四 胶体 力 ) 一 小 脑 ( 模 念 性 工作 ) 一 大 脑 
(推理 逻辑 常识 ) 一 心 ( 情 感 ) 。 

未 来 一 个 新 工种 特别 适合 女性 ， 这 束 是 “机 器 解释 师 ”。 例 如 我 
们 去 看 病 ， 如 果 有 一 位 德高望重 的 名 医 说 “ 没 哈 大事， 回去 多 哆 水 ， 


体 妃 两 天 束 好 了 ”， 这 病 有 可 能 会 好 一 半 。 因 为 人 体 许 多 疾病 是 靠 目 
己 的 免疫 系统 治 意 的 。 而 免疫 系统 的 功能 直接 和 心情 有 关 。 当 机 器 给 
人 打印 出 一 份 冷 冰冰 的 诊断 报告 时 ， 患 者 不 会 有 老大 夫 扣 屑 膀 安 慰 的 
放心 感觉 。 即 使 机 占 人 可 以 模仿 人 说 话 ， 也 是 假 模 假 样 的 。 人 至 少 在 可 
见 的 未 来 机 器 都 不 具备 真实 的 情感 ， 更 谈 不 上 同 理 心 、 同 情 心 等 人 类 
复杂 的 心理 活动 。 这 时 候 机 器 的 诊断 结果 需要 一 位 慈祥 的 女士 来 解释 
给 患者 听 。 这 位 女士 如 果 是 医生 当然 最 好 ， 但 有 一 些 医学 训练 的 护士 
足 疾 。 这 位 “机 器 翻 译 师 ”固然 要 懂 医 学 ， 但 更 重要 的 是 懂 患 者 的 心 
理 ， 包 括 了 解 患 者 的 背景 和 观察 患者 的 语言 行为 。 


妇女 在 工业 时 代 的 社会 地 位 比 农业 社会 高 是 因为 机 器 取代 了 肌 
肉 ， 女 人 可 以 和 男人 一 样 灵巧 地 操纵 很 多 机 器 。 在 信息 时 代 女 性 的 地 
位 进一步 提高 ， 因 为 信息 时 代 彻 底 抹 平 了 工作 对 肌肉 的 依赖 。 而 在 未 
来 的 智能 时 代 ， 机 器 长 于 逻辑 弱 在 情感 ， 让 女性 比 男性 有 了 明显 的 优 
势 。 

AI 是 否 会 造成 大 量 失 业 的 关键 在 于 AI 技 术 发 展 的 速度 。 如 果 取 代 
过 程 缓慢 ， 那 么 失业 人 口 将 被 其 他 工作 逐渐 吸收 ， 失 业 人 口 也 有 时 间 
重新 学 习 技 能 。 

农业 人 口 在 1840 年 占 美国 总 劳动 力 人 口 的 70%， 目 前 只 有 2%。 在 
170 多 年 中 每 年 减少 0. 7%， 这 样 很 容易 被 快速 发 展 的 工业 吸收 。 目 前 美 
国 每 年 仍然 有 24 万 农业 人 口 离 开 土 地 ， 这 差不多 是 美国 一 个 月 新 增 的 
就 业 人 口 。 我 们 要 未 雨 绸 织 的 是 如 果 AI 技 术 快 速 发 展 ， 在 一 代 人 的 时 
间 里 大 量 取 代 人 工 ， 那 么 我 们 将 会 看 到 怎样 一 个 社会 ? 


新 分 配制 度 : 无 条 件 收 入 还 是 无 条 件 培 
训 


如 果 社 会 出 现 大 规模 失业 ， 那 么 一 种 解决 方案 是 “无 条 件 基本 收 
入 ” (Universal Basic Income，UBI) 制度 。 该 制度 很 简单 : 不论 性 
别 、 收 入 、 职 业 、 教 育 情况 ， 政 府 给 每 人 每 月 发 放 一 定 的 基本 生活 
， 包 括 就 业 人 口 。 从 美国 到 巴西 、 加 拿 大 、 芬 兰 、 纳 米 比 亚 、 肯 尼 
、 印 度 都 在 实验 UBI。 瑞 士 2016 年 夏天 还 进行 过 一 次 关于 UBI 的 投 
议案 提议 政府 给 所 有 成 年 公民 每 月 约 2 500 美 元 生活 费 ， 给 未 成 年 
人 每 月 600 美 元 。 投 票 的 结果 是 23% 赞成 ，77% 反对 ， 议 案 被 否决 。 

支持 UBI 的 人 有 三 条 理由 。 


(1) 社会 上 有 许多 人 从 事 有 价值 的 工作 而 没有 收入 ， 例 如 全 职 母 
杀 。UBI 是 对 这 类 工作 价值 的 承认 。 


(2) 可 以 大 幅 缩 小 贫 富 差 距 。 美 国 阿拉 斯 加 州 的 收入 平等 水 平 曾 
经 在 美国 各 州 排名 第 30 位 (数目 越 大 越 不 平等 ) ， 自 从 1976 年 州 政府 
建立 了 石油 收入 支撑 的 永久 基金 并 给 每 个 公民 每 年 支付 ! 000 2 000 美 
元 《看 当年 石油 价格 ) 后 ， 阿 拉 斯 加 州 的 收入 平等 水 平 在 美国 各 州 跃 
升 到 第 二 位 。 纳 米 比 亚 2007 一 2012 年 的 实验 证 明 ， 实 施 一 年 后 贫困 率 
从 76% 降 到 37%， 在 6 个 月 内 儿童 营养 不 恨 率 从 42% 降 到 17%。 美 国 “ 经 
济 安全 项 目 ” 的 一 项 研究 表明 ， 给 美国 每 个 成 年 人 每 月 1 000 美 元 ， 
个 未 成 年 人 每 月 300 美 元 可 以 全 部 消除 贫困 。 (美国 人 口 3. 24 亿 ， 其 中 
成 年 人 口 2.5 亿 ， 这 样 每 年 支出 约 3. 3 万 亿美 元 。 目 前 美国 联邦 政府 总 
预算 约 4 万 亿美 元 ， 联 邦 、 各 州 及 所 有 地 方 政府 的 财政 预算 总 和 约 7 万 
亿美 元 ， 占 GDP 的 35%。 ) 


(3) 可 以 提升 健康 水 平 ， 减 少 少年 儿童 辍学 ， 促 进 束 业 。 马 干 达 
的 一 项 “青年 机 会 计划 ” 豆 励 青年 投资 自己 的 技能 培训 ， 使 收入 提高 
了 38%。 纳 米 比 亚 的 实验 把 辍学 率 从 40% 降 到 了 和 零 。 


反对 UBI 的 人 也 有 三 个 理由 。 
(1) 把 本 来 该 给 穷人 的 钱 给 了 那些 并 不 需要 的 人 。 
(2) 辟 励 好 吃 懒 做 。 


酒 局 器 


(3) UBI 需 要 的 那么 多 钱 从 哪儿 来 ? 


有 好 奇 的 读者 会 问 ， 为 什么 不 把 钱 只 给 穷人 ， 这 样 不 是 可 以 大 大 
降低 成 本 吗 ? 其 实 这 就 是 目前 各 国 实行 的 失业 救济 金 和 低 收入 保障 。 
问题 是 鉴别 谁 是 失业 人 口 和 需要 救济 的 人 口 的 成 本 很 高 ， 当 大 规模 失 
业 突 如 其 来 时 无 法 应 付 。 

笔者 认为 ，UBI 最 大 的 问题 在 于 太 郧 贯 ， 其 他 都 不 是 问题 。 笔 者 建 
议 与 其 实行 无 条 件 基本 收入 ， 不 如 实行 “无 条 件 基 本 培训 ” 
(Universal Basic Training，UBT) ， 即 对 所 有 愿意 工作 的 成 年 人 提 
供 培训 费用 。 这 笔 钱 并 不 发 给 个 人 ， 而 是 发 给 培训 机 构 〈( 要 有 措施 防 
止 作 浆 ) 。 受 培训 的 成 年 人 只 有 通过 第 三 方 考试 机 构 的 相应 考试 后 才 
能 人 免除 这 笔 培训 费用 。 以 目前 的 个 人 识别 技术 指纹 、 刷 脸 和 等) ， 这 
些 考试 可 以 轻易 在 线 举 行 。 由 于 这 些 培 训 项 目 针 对 的 是 那些 失业 者 ， 
学 习 重 新 就 业 的 技能 需要 花 时 间 精 力 ， 所 以 不 是 真正 需要 工作 的 人 或 
者 有 不 错 收 入 的 人 不 会 去 占 这 个 便宜 。 还 以 美国 为 例 ， 目 前 失业 率 已 
经 达到 3. 9% ， 约 608 万 人 ， 已 经 达到 了 充分 就 业 率 。 假 设 目前 失业 率 
为 10%， 而 我 们 希望 达到 4%， 这 样 大 约 有 960 万 人 需要 通过 培训 就 业 。 
假设 每 人 每 年 职业 培训 费用 为 1 万 美元 ， 每 年 的 总 培训 费用 为 960 亿 美 
元 ， 这 只 是 UBI 3. 3 万 亿美 元 的 3%， 占 美国 GDP 的 0. 5%。 即 使 失业 率 达 
到 20%， 培 训 费 用 达到 2 560 亿 美元 ， 也 分 别 只 是 UBI 成 本 的 8% 和 美国 
GDP 的 1. 3%。 


贫 富 惹 殊 解 决 之 才 : 民间 公益 


过 去 100 年 来 的 技术 进步 惠及 了 所 有 的 人 ， 但 是 分 布 却 极 不 均衡 。 
虽然 每 个 人 的 绝对 生活 水 平 都 大 幅 提高 ， 但 相对 差别 不 是 减少 而 是 增 


加 了 。 图 7. 1 是 把 美国 地 图 面积 作为 美国 的 总 财富 来 直观 显示 不 同 阶层 
人 和 群 在 总 财富 里 的 占 比 。 


1% 的 人 口 会 


拥有 这 些 


20% 的 人 品 2 


会 拥有 这 些 es 


图 7.1 美 国 不 同 阶层 人 群 占有 财富 的 比例 


图 片 来 源 : http://owsposters. tumblr. com/post/11944143747/if-us-land-mass- 
were-distributed|ike-us。 


如 图 7. 1 所 示 ， 美 国 最 富有 的 1% 的 人 口 占 有 几乎 40% 的 财富 ， 最 
富有 的 10% 的 人 口 占有 80% 的 财富 。 最 穷 的 40% 的 人 口 只 占有 不 到 1% 
的 财富 。 在 世界 各 国 里 ， 美 国 的 贫 富 差 距 还 不 是 最 大 的 ， 中 国 、 已 
西 、 Se 富 差距 更 大 。 网 7. 2 是 世界 各 国 的 基尼 系数 〈 系 
数 越 大 ， 贫 富 差 距 越 大 ) 。 


巴西 55 
墨西哥 48 
中 国 47 
美国 41 
俄罗斯 40 
意大利 36 
英国 36 
澳大利亚 35 
西班牙 35 
印度 33 
法 国 33 
加 拿 大 33 
韩国 32 
德国 28 
日 本 25 
注 : 0= 收 入 完全 平等 ，100= 收 入 最 不 平等 


图 7.2 世 界 各 国 的 基尼 系数 


图 片 来 源 : http://www. kkr. com/global-perspectives/publications/china- 
transition。 


美国 的 贫 是 差距 主要 由 三 个 因 系 造成 。 一 是 代 际 传递 ， 富 人 的 遗 
产 留 给 孩子 ， 资 本 增值 比 劳 动 增值 更 快 ， 因 此 富 的 越 证 ， 穷 的 越 穷 。 
二 是 全 球 化 劳动 力 流动 性 增加 ， 加 工业 和 制造 业 大 批 流向 以 中 国 为 主 
的 发 展 中 国家 ， 造 成 大 批 蓝领 失业 。 三 是 科技 使 财富 向 科技 创业 成 功 
者 高 度 集中 。 中 国 的 贫 富 差距 也 有 三 个 原因 ， 其 中 有 两 个 和 美国 不 
同 ， 一 个 相同 。 第 一 个 不 同 是 过 去 城乡 二 元 政策 造成 的 广大 农村 的 数 
亿 贫 困 人 口中 仍然 有 相当 一 部 分 没有 脱贫 。 第 二 个 不 同 是 国家 控制 的 
资源 有 相当 一 部 分 在 权 钱 交换 中 集中 到 少数 人 手中 。 和 美国 相同 的 


是 ， 科 技 使 财富 回 科 技 创 业 成 功 者 聚集 。 注 意 前 两 者 通常 伴随 痢 对 弱 
势 群体 或 贫困 人 群 的 剥 和 于 ， 也 就 是 它们 不 仅 使 请 人 更 富 ， 也 使 务 人 更 
穷 ， 而 科技 进步 造成 的 贫 富 差 别 只 是 让 富 人 更 宣 但 并 没有 让 穷人 更 
穷 。 随 着 扶贫 计划 的 开展 和 转移 支付 的 加 大 ， 农 村 的 绝对 贫困 人 口 会 
逐渐 减少 。 随 着 法 治 的 健全 ， 权 钱 交 换 也 会 被 抑制 。 只 有 科技 进步 造 
成 的 贫 富 相对 差距 目前 并 没有 好 的 解雇 之 道 。 法 国 经 济 学 家 托马斯 。 
皮 凯 蒂 (Thomas Piketty) 在 《21 世 纪 资 本 论 》 中 建议 征收 “财富 
税 ”， 即 针对 每 个 人 拥有 的 所 有 财产 (包括 房产 、 证 券 、 现 金 、 保 险 
等 ) 每 年 征收 1% 2% 的 税 。 这 个 税种 不 仅 严重 抑制 企业 家 创新 动力 ， 

而 且 把 钱 交 给 政府 效率 一 定 很 低 。 丹 麦 曾经 征收 过 财富 税 ， 在 20 世 纪 
80 年 代 后 期 该 财富 税 最 高 达到 2. 24， 也 即 你 的 财富 如 果 不 增 值 45 年 就 
被 国家 征 光 了 。 实 践 证 明 这 个 税种 在 抑制 经 济 发 展 的 同时 并 未 缩小 贫 
富 差 距 ， 和 丹麦 自 1997 年 后 就 取消 了 这 个 税种 。 其 他 一 些 富裕 欧洲 国家 
也 都 有 类 似 答 试 ， 最 后 都 取消 了 这 个 税种 。 

缩小 贫 富 差 距 的 一 个 可 行 的 方案 就 是 通过 民间 人 公益。 比尔， 新 次 
现在 全 职 做 公益 ， 他 和 巴菲特 把 99% 的 财产 都 捐 出 来 ， 要 在 有 生 之 年 
全 部 花 在 公益 上 。 他 花 上 自己 注 兰 赚 来 的 钱 一 定 比 政府 花 别人 的 钱 用 心 
得 多 。 作 为 一 个 成 功 企业 家 ， 他 选择 自己 认可 的 项 目 ， 执 行 项 目 、 评 
估 项 目的 能 力 都 远 高 于 一 般 政 府 官 员 ， 这 里 几乎 不 会 有 跑 冒 滴漏 和 贫 
腐 。 更 重要 的 是 ， 当 大 批 成 功 企业 家 都 投入 公益 时 ， 会 上 自然 形成 一 个 

“公益 市 场 ”。 企 业 家 不 仅 可 以 根据 自己 的 资源 、 爱 好 和 优势 选择 公 
益 方 向 ， 效 率 甜 的 公益 项 目 也 会 被 自然 淘汰 。 

无 论 是 比尔 ， 蓄 次 还 是 马云 ， 他 们 个 人 和 家 性 所 能 消耗 的 财富 在 
他 们 自己 的 财 定 中 者 微不足道。 聪明 的 家 长 都 知道 留 给 孩子 太 多 钱 是 
祸害 ， 所 以 中 外 很 多 的 成 功 企业 家 都 将 自己 的 大 部 分 财富， 在 他 们 有 
生 之 年 全 部 花 到 自己 认为 重要 的 公益 项 目 中 去 。 作 为 政府 ， 应 该 通过 
一 系列 法 律 政策 鼓励 民间 公益 ， 支 持 形 成 一 个 公益 市 场 和 公益 生态 。 
这 样 不 仅 避 免 了 高 税收 造成 的 创业 意愿 降低 ， 避 免 了 征 税 成 本 和 文 付 


中 的 损耗 ， 更 重要 的 是 能 够 以 最 高 的 效率 和 最 创新 的 方式 缩小 贫 军 3 
距 。 


改善 贫 富 差距 的 第 二 个 方案 是 增加 休息 日 和 延长 假期 。 一 个 令 人 
腓 夷 所 思 的 现象 是 当中 国 从 每 周 工作 六 天 改变 为 每 周 工作 五 天 时 ，GDP 
不 仅 没有 下 降 相 应 的 1/6， 反 而 持续 增长 。 经 济 学 家 的 解释 是 多 出 一 天 
的 休息 时 间 增加 了 消费 ， 前 提 是 人 们 普遍 拥有 积蓄 ， 但 没有 时 间 消 
费 。 根 据 同样 的 原理 ， 可 以 将 五 天 工作 制 改 为 四 天 、 三 天 。 也 可 以 进 
一 步 延长 假期 ， 例 如 除了 春节 以 外 ， 清 明 、 端 午 、 中 秋 都 变 为 长 假 
期 。 每 年 的 年 假 也 可 以 延长 到 三 周 、 四 周 ， 甚 至 可 以 考虑 让 家 长 和 防 
子 一 起 放 暑 假 和 寒假。 逐渐 增加 休息 时 间 ， 带 来 了 消费 的 增加 ， 所 以 
总 体 GDP 并 不 一 定 会 下 降 。 对 企业 来 讲 ， 每 个 人 的 工作 时 间 变 短 ， 要 完 
成 同样 的 工作 量 ， 意 味 着 需要 增加 人 手 ， 这 样 就 会 降低 失业 率 。 那 读 
者 要 间 ， 这 样 岂 不 是 增加 了 企业 的 成 本 吗 ”如果 全 社会 都 是 同样 的 芝 
动 时 间 ， 企 业 利润 的 长 期 决定 因素 则 是 市 场 愿意 支付 的 价格 。 企 业 为 
了 保持 一 定 的 利润 ， 要 么 提高 效率 ， 要 么 削减 工资 ， 前 者 推动 创新 ， 
后 者 则 是 一 种 市 场 化 的 也 即 无 损耗 的 转移 支付 。 

不 论 是 “无 条 件 基本 收入 ”还 是 大 幅 增 加 休息 时 间 都 属于 比较 激 
进 的 应 对 大 规模 失业 的 措施 。 笔 者 不 认为 尤 瓦 尔 。 谈 拉 利 所 担心 的 大 
规模 失业 会 突然 出 现 。 基 于 对 目前 技术 的 理解 和 近年 来 商业 的 发 展 ， 
AT 对 产业 的 影响 虽然 是 颠覆 性 的 ， 但 不 会 在 一 夜 之 间 发 生 。 


权力 再 分 配 


历史 上 每 次 技术 音 命 都 会 改变 权力 的 分 配 。 过 去 40 年 的 信息 革命 
让 每 个 人 可 以 及 时 得 到 信息 ， 及 时 传播 思想 ， 大 大 增加 了 个 人 的 力 
量 。 技 术 革 命 甚 至 会 改变 地 缘 政 治 。 在 汽车 时 代 之 前 ， 中 东 是 世界 上 


最 贫穷 的 地 方 之 一 ， 也 非 大 国 博 穿 之 处 ， 一 旦 世界 进入 依赖 石油 的 时 
代 ， 中 东 的 产 油 国 摇身一变 成 为 巨 语 ， 这 些 战略 财富 也 引发 了 许多 战 
争 。 当 有 一 天 大 街 上 全 部 都 是 电动 汽车 时 ， 中 东 可 能 又 变 回 到 大 家 不 
感 兴趣 的 沙漠 地 帝 ， 而 定 产 电池 原料 的 刚果 则 变 成 大 国 必 争 之 地 。 


技术 革命 把 权力 在 政府 、 企 业 和 个 人 三 者 之 间 重 新 分 配 ， 并 不 一 
定 每 次 都 倾向 于 个 人 。 例 如 当 计 算 机 还 在 大 型 机 阶段 时 ， 大 型 机 的 霸 
主 IBM 成 为 美国 最 有 权力 的 公司 之 一 。 个 人 电脑 革命 的 社会 动力 是 美国 
的 一 批 年 轻 人 感到 未 来 信息 时 代 被 一 家 公司 (当时 是 IBM) 控制 非常 恐 
怖 ， 所 以 第 一 个 微 处 理 器 蕊 片 刚 问世 ， 就 立即 得 到 了 这 批 年 轻 人 的 热 
烈 拥 把。 乔布斯 、 盖 次 的 理想 是 每 个 人 都 能 拥有 自己 的 电脑 。 个 人 电 
脑 和 互联 网 襄 无 疑问 会 极 大 地 给 个 人 赋 能 ， 增 加 个 人 的 权力 ， 但 后 来 
的 大 数据 和 云 计 算 则 相反 ， 又 把 权力 转移 到 了 大 公司 和 政府 手中 。 许 
多 国家 的 政府 对 互联 网 一 开始 都 持 怀 疑 和 谨慎 态度 ， 但 它们 对 大 数据 
和 云 计 算 从 一 开始 就 热烈 拥抱 。 因 为 大 数据 和 云 计算 不 仅 需 要 巨大 的 
资源 ， 而 且 集中 在 一 起 〈 在 数据 中 心 ) 易于 控制 ， 更 重要 的 是 大 数据 
可 以 增加 政府 对 社会 的 管理 和 控制 能 

那么 这 次 的 AI 浪潮 又 会 造成 什么 样 的 权力 分 配 昵 ? 在 过 去 几 年 中 
我 们 明显 看 到 AI 进一步 将 权力 集中 到 大 公司 和 政府 手中 。AI 的 核心 资 
源 是 处 理 心 片 和 数据 ， 目 前 蕊 片 集中 在 以 英 伟 达 为 首 的 少数 几 家 蕊 
公司 手中 。 数 据 则 分 为 三 类 ， 第 一 类 是 互联 网 用 户 或 者 消费 者 数据 ， 
目前 集中 在 世界 互联 网 公司 巨头 手中 。 第 二 类 是 行业 数据 ， 例 如 医 
疗 、 金 融 等 ， 集 中 在 行业 的 龙头 公司 手中 。 第 三 类 是 社会 数据 ， 集 中 
在 政府 手中 。 许 多 AI 的 应 用 由 于 和 大 数据 不 可 分 离 ， 自 然 是 给 大 公司 
或 政府 赋 能 。 例 如 人 脸 识 别 技术 从 一 开始 就 得 到 中 国政 府 的 大 力 文 
持 ， 在 全 国 遍 地 开花 。 在 短 短 的 几 年 中 ， 从 支付 到 购物 再 到 出 行 都 已 
经 开始 “ 刷 脸 ”。 现 在 全 国 已 经 有 上 亿 个 监控 摄像 头 ， 未 来 更 会 做 到 
无 颖 覆盖 。 


AI 技术 有 可 能 给 个 人 赋 能 吗 ? 目前 看 来 可 能 有 两 个 方向 。 一 个 方 
问 是 手机 中 的 AI 功能 ， 例 如 物体 识别 、 智 能 助理 和 目 然 语 言 理 解 等 。 
因为 手机 给 个 人 赋 能 ， 凡 是 增加 手机 能 力 的 都 能 增加 个 人 能 力 。 第 二 
个 方向 是 AI 的 资源 开源 化 ， 这 里 包括 源 代码 、 程 序 库 和 云端 AI 能 
这 些 AI 资 源 的 普及 将 使 人 们 在 AI 领 域 的 创业 成 本 降低 ， 几 个 聪明 的 孩 
子 就 可 以 做 大 公司 做 不 了 的 事情 。 


是 否 该 信任 机 器 的 决定 


随 看 机 器 学 习 能 力 的 增加 和 了 瞳 知识 的 大 爆炸 ， 未 来 越 来 越 多 的 决 
定 将 交 给 机 器 去 做 。 这 些 决 定 可 以 从 疾病 的 诊断 到 职业 的 选择 ， 可 以 
从 商业 的 决策 到 政策 的 制定 ， 甚 至 战争 的 决策 ， 许 多 决定 牵涉 巨大 的 
经 济 利益 甚至 人 命 。 当 人 类 无 法 做 出 最 适当 的 决定 时 ， 是 否 该 信任 机 
器 的 决定 ? 

要 回答 这 个 问题 ， 我 们 需要 把 机 器 决定 的 场景 分 为 两 类 : 第 一 类 
是 反复 出 现 的 场景 ， 第 二 类 是 从 来 没 出 现 过 的 场景 。 

第 一 类 场景 的 典型 是 自动 驾驶 。 在 这 类 场景 中 ， 人 类 对 机 强 的 信 
任 和 今天 对 一 家 大 型 客机 上 软件 的 信任 没有 本 质 区 别 。 只 要 场景 是 反 
复出 现 的 并 且 有 时 间 去 测试 ， 我 们 就 可 以 通过 长 时 间 的 测试 来 验证 机 
右 的 可 靠 性 ， 这 正 是 今天 所 有 自动 驾驶 公司 在 做 的 事 : 经 年 昧 月 地 在 
大 街 上 要 驶 ， 不 断 提 高 可 靠 性 。 这 类 场景 还 有 一 种 情况 是 疾病 诊断 ， 
虽然 机 器 是 第 一 次 对 某 个 病人 下 诊断 ， 但 机 器 已 经 正确 地 诊断 了 许多 
其 他 类 似 的 病人 。 所 以 不 论 是 个 人 生活 中 的 决策 ， 还 是 商业 决策 ， 只 
要 机 器 有 过 在 类 似 场 景 下 大 量 的 测试 ， 惑 可 以 信任 机 器 。 当 然 这 里 不 
排除 机 器 出 错 的 概率 ， 这 和 不 排除 有 经 验 的 医生 误诊 ， 不 排除 大 型 客 
机 的 软件 出 故障 一 样 。 


第 二 类 场景 的 典型 是 一 场 战 争 的 决策 。 机 器 很 难 有 在 实际 战争 中 
反复 测试 的 机 会 ， 即 使 有 ， 每 场 战 争 的 性 质 也 大 不 相同 。 在 这 种 场合 
人 人 尾 须 负 起 责任 。 那 是 不 是 说 机 器 在 这 种 场合 就 完全 没 用 了 呢 ? 不 
是 。 如 果 能 有 历史 战争 数据 ， 比 如 战场 的 视频 和 卫星 图 片 ， 机 器 仍然 
可 以 从 这 些 海量 信息 中 发 现 隐蔽 的 关系 ， 也 即 暗 知 识 。 机 口 也 可 以 模 
拟 战 争 场景 ， 就 像 今 天 自动 驾驶 系统 也 可 以 用 模拟 环境 训练 一 样 。 所 
以 即使 机 器 无 法 在 实际 场景 中 测试 ， 仍 然 有 可 能 为 人 类 决策 提供 辅助 
文 持 。 


数据 如 何 共有 学 


AI 应 用 依赖 数据 ， 数 据 越 多 、 越 广 ，AI 优 化 的 效果 就 越 好 。 目 前 
的 数据 都 是 一 个 一 个 的 扳 品 ， 占 有 数据 的 机 构 不 一 定 能 最 有 效 地 利用 
数据 。 目 前 占有 数据 的 企业 没有 动力 把 目 己 的 数据 分 享 给 别人 ， 要 解 
决 数据 共 至 必须 解决 以 下 两 个 问题 。 

第 一 ， 动 力 机 制 。 共 至 的 好 处 是 什么 或 者 不 共享 的 坏处 是 什么 ? 
一 个 方案 是 建立 数据 交易 平台 。 提 供 数据 可 以 赚钱 ， 使 用 数据 要 付 
费 。 这 里 的 核心 是 根据 数据 的 数量 和 质量 对 数据 进行 定价 。 

第 二 ， 隐 私 与 安全 。 企 业 的 数据 涉及 用 户 隐 私 或 企业 机 密 。 用 户 
的 映 份 信息 必须 隐 挥 ， 这 样 即使 信息 被 破解 也 无 法 对 用 户 造成 伤害 。 
企业 的 数据 也 需要 加 密 ， 这 样 即 使 数据 共 至 平台 也 无 法 看 到 信息 。 如 
何 既 能 加 密 又 能 使 用 数据 则 是 目前 的 一 个 研究 热点 。 以 目前 的 分 布 式 
数据 技术 ， 企 业 的 数据 不 必 离 开 自 己 的 服务 占 或 数据 中 心 ， 这 样 分 译 
数据 的 企业 心里 更 踏实 。 


同样 的 道理 ， 政 府 也 应 该 根据 上 述 原 则 尽 可 能 公开 数据 。 这 些 数 
据 本 来 就 是 公共 资源 ， 是 比 金 矿 更 好 的 资源 ， 金 矿 一 个 人 挖 完了 第 二 


个 人 融 控 不 到 了 ， 数 据 矿 可 以 让 成 千 上 万 人 用 不 同 的 方法 挖 到 不 同 的 
宝贝 。 


目 导 的 来 源 


不 论 采 取 什 么 样 的 措施 ， 如 果 机 器 代 蔡 人 工 的 势头 来 得 太 狐 烈 ， 
大 规模 的 结构 性 失业 总 是 很 难 避 免 的 。 一 种 极端 的 情况 是 当 茶 些 行业 
彻底 被 机 器 取代 后 ， 该 行业 的 相当 一 部 分 从 业 人 员 再 也 没有 能 力 掌握 
其 他 行业 的 就 业 技 能 。 如 果 这 个 群体 很 大 ， 残 会 变 成 一 个 社会 问题 。 
对 这 部 分 人 群 除了 给 予 基 本 生活 救济 以 外 ， 还 应 该 关注 他 们 的 心理 健 
康 。 其 中 最 重要 的 是 自尊 感 的 来 源 。 长 期 失业 的 人 即使 基本 生活 有 保 
隐 ， 也 会 形 失 价值 感 。 他 们 在 家 庭 和 社会 中 也 会 感觉 低 人 一 等 ， 长 此 
以 往 会 造成 抑郁 ， 导 致 柄 酒 其 至 吸毒 。 一 个 人 的 目 恒 主要 来 自 对 社会 
和 他 人 的 贡献 ， 可 以 和 金钱 无 大 。 上 所 以 获得 目 章 的 一 个 重要 途径 是 参 
加 各 种 社会 公益 组 织 ， 在 公益 组 织 中 不 仅 能 够 找到 上 自己 的 价值 ， 而 且 
能 找到 群体 的 归属 感 。 这 就 要 求 社会 大 力 鼓 励 发 展 各 种 类 型 的 公益 组 
织 ， 让 每 个 人 都 能 找到 自己 愿意 参加 的 公益 活动 。 任 何 一 个 社会 都 会 
有 大 量 的 服务 性 工作 无 法 由 商业 完成 ， 因 为 商业 要 产生 利润 ， 而 有 些 
被 服务 的 人 群 没 有 相应 的 文 付 能 力 ， 例 如 贫困 和 部 分 老年 人 群 。 这 些 
“闲人 ”相互 之 间 的 服务 也 是 一 个 很 大 的 需求 ， 这 就 是 开玩笑 说 的 
“你 给 我 揉 肩 ， 我 给 你 手背 ”。 

自 导 的 第 二 个 来 源 是 个 人 独特 的 价值 ， 包 括 比 周围 人 更 好 的 技能 
(体育 、 游 戏 、 音 乐 、 舞 蹈 、 绘 画 、 阅 读 、 讲 笑话 、 养 生 、 健 身 、 手 
工 等 ) 。 这 些 才 能 才艺 的 开发 和 友 挥 同样 需要 社会 公 益 组 织 ， 即 组 织 
各 种 爱好 者 俱乐部 。 这 些 形形色色 的 社会 公益 组 织 可 以 由 富裕 人 群 捐 
Hs 


如 果 政 府 能 够 给 这 些 无 法 再 就 业 的 人 群 提供 一 个 基本 生活 保障 ， 
通过 形形色色 的 社会 公益 组 织 再 给 这 些 人 提供 尊严 感 和 归属 感 ， 这 个 
人 和 群 的 羊 福 感 就 会 大 大 加 强 。 


机 器 会 产生 自我 意识 吗 


包括 马 斯 克 、 霍 金 等 人 都 非常 担心 AI 有 一 天 会 控制 人 类 。 在 机 器 
能 控制 人 类 之 前 ， 机 器 必须 产生 目 我 意识 。 目 我 意识 是 一 个 复杂 问 
题 ， 到 今天 都 没有 公认 的 严格 定义 ， 但 大 致 上 目 我 意识 是 指 一 个 人 对 
目 己 存在 的 知觉 ， 或 者 说 明确 知道 自己 和 周围 的 环境 (他 者 ) 的 区 
别 。 人 的 自我 意识 并 非 天 生 束 有 ， 而 是 儿童 在 大 约 18 个 月 开始 产生 
的 。 纽 约 州立 大 学 奥 尔 巴 尼 校区 的 戈 登 。 凋 洛 普 教授 (Gordon 
Gallup) 在 1970 年 设计 了 一 个 简单 巧妙 的 测试 自我 意识 的 实验 。 实 验 
是 这 样 进行 的 ， 先 让 一 个 儿童 看 到 镜子 里 的 自己 ， 然 后 在 不 让 他 察觉 
的 情形 下 在 他 的 脸颊 上 贴 上 一 张 明 显 的 记号 (例如 一 张 红 色 的 圆 扣 
纸 ) ， 再 让 孩子 对 着 镜子 。 如 有 果 孩 子 去 措 目 己 脸 上 这 个 记号 或 试图 斯 
下 来 ， 这 个 孩子 驶 被 认为 具有 了 目 我 意识 。 实 验证 明 ， 只 有 达到 一 定 
年 龄 〈 例 如 18 个 月 ) 的 孩子 才 会 有 目 我 意识 。 科 学 家 还 对 儿 十 种 动物 
包括 十 几 种 猴子 做 了 这 个 实验 ， 只 有 黑猩猩 这 一 种 动物 能 够 通过 这 个 
测试 。 而 其 他 动物 不 管 在 镜子 前 符 多 长 时 间 ， 永 远 都 会 把 镜子 里 的 目 
己 当成 “ 列 人 ”。 

共有 上 自我 意识 是 灵 长 类 动物 和 其 他 动物 的 本 质 区 别 ， 这 使 人 类 在 
进化 中 获得 了 巨大 优势 。 人 类 可 以 从 “自己 ”的 视角 观 峙 、 认 知 和 理 
解 世界 ， 并 最 终 根 据 目 己 的 意愿 改造 世界 。 人 类 根据 上 自己 的 知觉 记忆 
的 清晰 程度 开始 有 了 “时 间 ” 概 念 。 随 着 “时 间 ” 概 念 的 产生 ， 人 类 
可 以 想象 多 种 不 同 的 “未 来 ”， 即 那些 未 曾 发 生 的 事情 ， 创 造 力 产生 


了 。 人 类 获得 目 我 意识 的 最 大 代价 就 是 必须 面 对 一 个 无 法 理解 的 事 
实 : 自我 意识 终 将 消失 ，“ 自 己 ” 终 将 死亡 。 对 死亡 的 恐 慢 成 为 伴随 
人 一 生 的 恐 恨 。 一 旦 获得 了 自我 意识 的 “自己 ”， 束 再 也 无 法 理性 地 
理解 “自己 ”的 消失 ， 所 以 几乎 全 世界 所 有 的 宗教 都 是 从 “ 非 理 性 ” 
或 “超级 存在 ”的 角度 回应 死亡 的 问题 ， 至 少 能 提供 茶 种 解释 减少 人 
类 对 死亡 的 恐惧 。 


近年 来 随 着 脑 成 像 仪 器 的 成 熟 ， 关 于 意识 的 研究 有 了 许多 实验 性 
的 发 现 。 用 于 大 脑 研 究 的 主要 成 像 仪 器 是 功能 性 核磁 共振 成 像 仪 ， 该 
成 像 仪 的 原理 如 下 : 当 大 脑 茶 部 分 神经 元 激活 产生 电 脉冲 信号 时 ， 惑 
会 有 含 氧 量 高 的 新 鲜血 液 流 到 该 部 分 大 脑 去 丛 换 原先 氧气 已 经 耗 义 的 
血液 。 由 于 缺 氧 血液 的 磁性 比 富 氧 血液 蜗 ， 所 以 在 磁场 中 会 呈现 不 同 
的 信号 强度 。 借 此 原理 ， 核 磁 共 振 成 像 仪 就 可 以 看 出 大 脑 中 哪 部 分 神 
经 元 正在 活路 。 科 学 家 可 以 用 功能 性 核磁 共振 判断 一 个 人 是 否 有 意 
识 。 该 实验 要 求 被 实验 者 想 一 个 动作 如 打 网 球 ， 从 成 像 仪 上 可 以 看 到 
一 个 正 币 清醒 的 人 的 大 脑 皮 质 的 茶 一 个 特定 区 域 活跃 。 实 验 表 明 大 多 
数 人 在 想 同一 个 动作 时 相同 的 脑 区 域 活路 。 这 样 就 可 以 用 实验 判断 一 
个 对 外 来 信号 没有 任何 胶体 和 表情 反应 的 “植物 人 ”是 否 已 经 丧失 了 
意识 。 如 果 该 “植物 人 ” 听 到 指令 后 对 应 的 大 脑 皮 质 部 位 活跃 就 可 以 
认为 他 仍然 具有 意识 。 


加 利 福 尼 亚 州 理工 学 院 的 元 里 斯 托 弗 。 科 区 (Christof Koch) 教 
授 通 过 检测 单个 神经 元 信号 发 现 当 被 实验 者 看 到 自己 熟悉 的 影像 时 
《例如 喜爱 的 电影 演员 ) ， 某 一 个 神经 元 会 被 激发 而 其 他 神经 元 没有 
动静 。 每 次 看 到 这 个 演员 的 不 同 照 帮 时 ， 同 一 个 神经 元 都 会 被 激发 。 
甚至 在 看 到 这 个 演员 的 名 字 时 ， 同 一 个 神经 元 也 会 被 激发 。 但 如 果 看 
到 这 个 演员 和 其 他 人 的 合影 时 ， 这 个 神经 元 就 不 会 被 激发 。 

单个 的 神经 元 虽然 可 以 和 外 界 刺激 建立 一 对 一 的 对 应 关系 ， 但 是 
这 还 不 是 自我 意识 。 目 前 公认 的 自我 意识 是 许多 神经 元 共同 的 作用 。 
位 于 美国 威斯康星 州 的 精神 病 学 研究 所 (Psychiatric Institute and 


Clinic) 设计 了 一 种 精妙 的 实验 用 于 证 实意 识 在 大 脑 的 存在 是 一 个 整 
体 ， 而 不 是 条 个 部 分 。 仪 器 类 似 我 们 前 面 提 到 过 的 单 在 尖 上 的 “电极 
日 ”， 电 极 单 上 布 满 了 电极 ， 可 以 接收 到 来 自 大 脑 皮 质 不 同 部 位 的 电 
言 号 。 必 外 一 个 能 发 射 磁 场 的 电极 在 脑 充 的 不 同 部 位 发 射 磁 脉 冲 。 每 
个 磁 脉 冲 都 能 引起 大 脑 神经 元 的 激发 ， 通 过 分 布 在 头 上 不 同位 置 的 电 
极 就 可 以 观察 到 大 脑 不 同 部 位 神经 元 的 活动 。 实 验 发 现 当 受 试 者 清醒 
时 ， 每 次 脑 外 刺激 信号 在 脑 内 不 同 的 区 域 都 会 造成 激发 ， 移 是 离 刺 激 
电极 最 近 的 区 域 激发 ， 然 后 这 种 激发 先后 传导 到 大 脑 谈 质 的 不 同 区 
域 ， 这 些 激活 区 域 形成 复杂 的 图 案 。 但 当 受 试 者 入 睡 后 再 刺激 ， 友 现 
只 有 刺激 电极 附近 的 区 域 被 激活 ， 并 不 会 传导 到 其 他 区 域 。 这 个 实验 
证 明了 意识 是 大 脑 不 同 区 域 互 相传 导 连 通 后 的 共同 结果 ， 而 不 是 茶 个 
部 分 。 

遗憾 的 是 以 上 的 脑 神 经 研究 仍然 无 法 精准 地 定位 意识 在 大 脑 中 到 
底 是 以 什么 样 的 方式 产生 和 存在 的 。 但 这 些 研究 已 经 能 够 给 我 们 一 些 
局 示 来 回答 : 以 神经 网 络 为 基础 的 人 工 乔 能 是 否 能 在 不 远 的 将 来 产生 
自我 意识 呢 ? 

首先 ， 如 果 我 们 能 够 确认 “自我 意识 ”无 非 是 大 量 神经 元 之 间 复 
杂 的 激活 和 连接 模式 ， 那 么 我 们 应 该 可 以 预测 未 来 有 一 天 当 基 于 半 导 
体 或 生物 已 片 的 神经 网 络 足 够 复杂 时 ， 机 器 完全 可 能 产生 自我 意识 。 
但 这 个 神经 网 络 要 多 么 复杂 呢 ? 


第 一 个 问题 是 神经 元 的 数量 。 人 类 大 脑 大 约 有 1 000 亿 个 神经 元 ， 
每 个 神经 元 会 有 上 和 干 个 突 触 和 其 他 神经 元 相连 接 ， 也 就 是 说 人 脑 有 约 
100 万 亿 个 连接 。 目 前 谷歌 大 脑 已 经 达到 了 1 万 亿 个 连接 ， 芯 片上 晶体 
管 的 密度 增加 速度 已 经 开始 放 缓 ， 以 远 慢 于 摩尔 定律 (每 18 个 月 翻 
番 ) 的 速度 发 展 。 增 加 计算 能 力主 要 是 靠 多 核 ， 即 把 许多 CPU/GPU 封 装 
在 一 起 。 按 目前 的 发 展 速 度 来 看 ， 最 多 20 30 年 机 器 神经 网 络 就 能 够 达 
到 人 脑 的 连接 数 。 但 是 神经 元 和 连接 数量 只 是 一 个 必要 条 件 ， 即 使 达 
到 或 超过 人 脑 的 数量 也 未 必 能 产生 自我 意识 。 


第 二 个 问题 是 神经 元 之 间 的 连接 方式 。 目 前 的 机 器 神经 网 络 为 了 
数学 上 可 以 分 析 ， 工 程 上 实现 方便 ， 神 经 元 部 是 简单 清楚 地 分 成 许多 
层级 。 每 个 神经 元 要 么 是 只 和 下 一 层级 的 神经 元 相连 (例如 全 连接 网 
络 或 卷 积 网 络 ) ， 要 么 是 只 和 上 自己 相连 (例如 RNN，〉。 但 人 脑 中 的 神经 
元 根本 没有 清晰 的 层级 ， 而 是 在 一 个 三 维 空间 随机 的 、 复 杂 的 互联 。 
己 知 的 连接 有 短 连 接 和 长 连接 ， 前 者 是 附近 的 神经 元 之 间 的 连接 ， 后 
者 是 和 很 远 的 神经 元 之 间 的 连接 。 

第 三 个 问题 是 目前 的 人 工 神经 网 络 的 信号 输出 是 上 一 级 输入 加 权 
求 和 后 被 一 个 门限 截断 的 信号 ， 而 人 脑 中 每 个 神经 元 的 信号 强 弱 、 门 
限 的 高 低 都 可 能 不 同 。 也 就 是 说 目前 的 人 工 神 经 网 络 是 对 人 脑 大 大 简 
化 后 的 模仿 ， 这 种 简化 模仿 即使 达到 了 相同 的 神经 元 和 连接 数 也 不 一 
定 能 够 达到 人 脑 的 复杂 程度 。 


除了 以 上 三 个 问题 之 外 ， 更 重要 的 是 第 四 个 问题 ， 人 脑 中 各 处 充 
满 了 随机 性 ， 深 受 外 界 环境 的 影响 ， 这 种 复杂 系统 中 的 随机 性 是 产生 
“涌现 ”的 重要 条 件 。《〈“ 涌 现 ” 是 复杂 系统 中 的 一 个 概念 ， 比 如 会 
有 足够 复杂 的 无 机 化 合 物 的 “一 漂 死 水 ”会 在 一 道内 电 的 作用 下 涌现 
出 有 机 的 生命 。) 目前 的 人 工 神经 网 络 是 一 个 确定 性 系统 ， 虽 然 我 们 
可 以 在 网 络 里 引入 随机 性 ， 但 是 我 们 并 不 清楚 在 哪里 和 怎样 引入 这 些 
随机 性 。 这 样 的 随机 性 有 几乎 无 数 的 可 能 组 合 ， 任 何 “ 不 对 ”的 组 合 
都 可 能 使 系统 无 法 产生 “涌现 ”。 人 脑 是 动物 几 十 亿 年 进化 的 结果 ， 
其 中 淘汰 了 无 数 无 法 产生 意识 的 随机 组 合 。 从 这 点 上 看 人 工 神经 网 络 
征 否 能 最 终 “ 涌 现 ” 出 意识 仍然 是 一 个 巨大 的 问号 ， 也 许 需 要 非常 长 
的 时 间 和 非常 好 的 运气 。 


结束 语 


人 类 该 怎么 办 


一 切 都 清楚 地 表明 了 机 器 对 事物 间 隐 菩 的 相关 性 的 发 现 和 掌握 已 
经 远 超 人 类 。 机 器 学 习 正 在 拓展 出 人 类 知识 的 一 个 全 新 方向 ， 让 人 类 
可 以 利用 那些 自己 无 法 理解 的 瞳 知 识 去 解决 问题 ， 这 些 瞳 知识 的 总 量 
将 会 大 大 超过 人 类 积累 的 和 即将 发 现 的 明知 识 。 随 着 计算 能 力 的 提高 
和 各 类 算法 的 进展 ， 机 器 学 习 会 呈现 出 越 来 越 神奇 的 性 能 。 这 一 波 科 
技 进步 的 大 浪 在 可 预见 的 未 来 还 看 不 到 集注 的 迹象 。 


人 类 是 人 否 能 理解 知识 变 得 不 那么 重要 了 。 在 过 去 的 几 万 年 里 ， 人 
类 的 大 脑 永远 在 知识 获取 的 回路 当中 ， 没 有 “人 ”这 个 认 知 行为 的 主 
体 就 谈 不 上 知识 。 而 今天 一 切 都 题 桥 了 ， 机 器 也 成 了 认 知 主体 ， 可 以 
直接 从 数据 中 华 取 出 知识 来 ， 再 把 这 些 知识 应 用 到 世界 里 。 人 脑 第 一 
次 和 被 抛 出 了 知识 获取 的 回路 ， 机 器 甚至 会 成 为 压倒 性 的 认 知 主体 ， 越 
征 复杂 的 问题 ， 它 们 越 是 得 心 应 手 。 

这 并 不 是 人 类 第 一 次 发 明了 比 上 自己 强 的 工具 ， 从 第 一 次 折断 树 术 
作为 大 棒 开 始 ， 人 类 已 经 有 无 数 超过 自己 能 力 的 工具 。 只 不 过 这 次 不 
再 是 比 人 的 腹 膊 力气 大 ， 比 腿 跑 得 快 ， 比 眼睛 看 得 远 ， 而 是 比 大 脑 更 


能 党 察 万 事 万 物 间 的 隐蔽 关系 。 在 机 器 没 有 演化 出 目 我 意识 之 前 ， 它 
们 仍然 是 人 类 任 劳 任 息 的 工具 。 


一 代 代 更 聪明 的 机 器 将 不 分 尽 夜 地 工作 ， 进 入 每 一 个 可 以 产生 数 
据 的 生活 、 生 产 和 消费 过 程 。 机 器 将 从 这 些 过 程 中 不 断 发 现 新 的 知 
识 ， 反 过 来 再 用 于 改进 这 些 过 程 使 效率 更 高 。 没 有 任何 一 个 重要 的 领 
域 不 被 机 器 涉足 ， 没 有 任何 一 个 人 不 被 机 器 影响 。 

对 机 器 知识 的 占有 不 仅 会 改变 权力 的 分 配 ， 也 会 改变 权利 的 定 
义 。 我 们 所 熟知 的 社会 规范 ， 诸 如 自由 、 平 等 、 公 平 、 正 义 在 瞳 知 识 
的 衬托 下 将 会 改变 原来 的 意义 。 我 们 要 重新 审视 我 们 过 去 熟悉 的 观 
念 ， 重 新 思考 什么 是 一 个 “好 ”的 社会 。 

机 器 改写 了 知识 的 地 图 ， 却 无 法 改变 人 的 本 性 。 人 类 还 是 那个 利 
他 与 自私 同体 ， 同 情 与 冷酷 兼备 的 人 类 。 对 于 这 样 一 个 新 的 强大 工 
具 ， 生 存 本 能 将 驱使 人 类 用 它 为 已 谋 利 ， 博 弈 困境 也 必 将 导致 用 它 来 
伤害 他 人 ， 对 机 器 的 驾驭 和 瞳 知识 的 掌握 势必 改变 现 有 的 地 缘 平 衡 。 

在 造福 人 类 的 同时 ， 和 过 去 500 年 中 大 部 分 新 科技 一 样 ， 机 器 将 带 
来 不 可 预知 的 改变 和 挑战 。 这 些 改变 无 法 阻挡 ， 只 能 顺势 而 为 ， 这 些 
挑战 无 法 避免 ， 只 能 创造 性 地 应 对 。 人 类 在 过 去 的 500 年 中 经 历 过 无 数 
挑战 ， 与 之 相 比 这 次 不 算 最 大 。 在 可 见 的 未 来 ， 人 类 要 担心 的 不 是 机 
器 ， 人 类 社会 的 最 大 风险 仍然 来 自 人 类 本 身 。 
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附录 1: 一 个 经 典 的 5 层 神经 网 络 LeNet-5 


图 附 1. 1 是 由 人 工 智能 大 神 之 一 岩 。 拉 孔 《CNN 的 发 明 人 ) 提出 的 
典型 的 卷 积 网 络 LeNet-5。 这 个 网 络 的 左边 是 输入 的 待 识别 的 图 像 ， 最 
右边 有 10 个 输出 ， 因 此 可 以 识别 10 种 不 同 的 图 像 ， 例 如 手写 体 的 0， 
1，2，.…，9。 
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图 附 1.1 岩 - 拉 扎 提出 的 卷 积 网 络 LeNet-5 

图 片 来 源 : http://yann. lecun. com/exdb/1lenet/。 

输入 图 像 的 大 小 是 32X32。 网 络 的 第 一 层 是 卷 积 层 ， 所 谓 “ 卷 
只 ”就 是 拿 着 各 种 不 同 的 小 模板 《图 附 1. 1 的 模板 大 小 是 5X5) 在 一 张 
大 图 上 滑动 找 相 似 的 图 形 (每 个 模板 是 一 个 特定 的 图 形 ， 例 如 三 角 、 
方块 、 直 线 、 弧 线 等 )。 模 板 在 大 图 中 一 个 一 个 像素 滑动 ， 在 每 一 个 
滑动 位 置 ， 都 把 大 图 上 的 像素 值 和 模板 对 应 的 像素 值 相 乘 再 全 部 加 起 
来 ， 把 这 个 加 总 之 和 作为 一 个 新 的 输出 像素 。 当 模板 滑动 过 所 有 像素 
时 ， 这 些 新 的 像素 就 构成 一 张 新 的 大 图 。 在 模板 滑动 过 程 中 ， 每 当 辜 


上 大 图 中 有 类 似 模 板 上 的 图 形 ( 即 在 大 图 上 这 个 区 域 的 图 形 和 模板 重 
合 度 高 时 ) ， 新 的 像素 值 就 会 很 大 。 图 附 1. 1 的 模板 尺寸 是 5X5， 因 此 
在 32X32 的 输入 图 像 上 横竖 都 只 能 滑动 28 次 ， 所 以 卷 积 的 结果 是 一 张 
28X28 的 图 片 。 在 这 个 网 络 里 ， 第 一 层 使 用 了 6 个 模板 ， 所 以 第 一 层 卷 
积 后 出 来 6 张 28X28 的 图 片 。 


苍 积 的 结果 出 来 后 ， 对 每 一 个 像素 还 要 做 一 个 “ 非 线 性 ”处 理 。 
一 种 “ 非 线 性 ”处 理 方法 就 是 把 所 有 小 于 零 的 像素 值 用 零 来 代 蔡 ， 这 
样 做 的 目的 是 让 网 络 增加 复杂 性 ， 可 以 识别 更 复杂 的 图 形 。 


网 络 的 第 二 层 叫 采样 层 (down-sampling ) 或 汇集 层 
(pooling) ， 简 单 讲 采样 层 就 是 把 大 图 变 小 图 。 在 这 个 网 络 里 ， 采 样 
的 方法 是 用 一 个 2X2 的 透明 小 窗 在 图 片上 滑动 ， 每 次 挪动 2 个 像素 。 
挪动 一 个 位 置 ， 把 小 窗 内 的 4 个 像素 的 最 大 值 取出 来 作为 下 一 层 图 片 中 
的 一 个 像素 (除了 取 最 大 值 ， 也 可 以 有 取 平 均值 等 其 他 方法 ) 。 经 过 
这 样 的 采样 ， 就 产生 了 下 一 层 6 张 14X14 的 图 片 。 

这 个 网 络 的 第 三 层 又 是 一 个 卷 积 层 ， 这 次 有 16 个 5X5 大 小 的 模 
板 ， 在 14X14 的 图 片上 产生 16 张 10X10 的 图 片 5X5 的 模板 在 14X14 
的 图 片 的 横竖 方向 上 都 只 能 滑动 10 次 ) 。 


第 三 层 做 完 非 线性 处 理 后 ， 第 四 层 又 是 一 个 采样 层 ， 把 16 张 
10X10 的 图 片 变 成 16 张 5X5 的 图 片 。 


第 五 层 再 次 用 120 个 5X 5 模板 对 16 张 5X5 的 图 片 做 卷 积 。 每 个 模板 
同时 对 所 有 16 张 图 片 一 起 卷 积 ， 每 个 模板 产生 一 个 像素 ， 一 共产 生 120 
个 像素 ， 这 120 个 像素 就 成 为 下 一 层 的 输入 。 从 这 里 开始 ， 原 始 的 一 张 
32X32 的 输入 图 片 变 成 了 120 个 像素 。 每 个 像素 都 代表 着 某 个 特征 。 从 
这 一 层 开 始 下 面 就 不 再 做 卷 积 和 采样 了 ， 而 是 变 为 “全 连接 ”的 标准 
神经 网 络 ， 即 第 五 层 的 120 个 神经 元 和 第 六 层 的 80 个 神经 元 中 的 每 一 个 
都 连接 。 〈 不 要 问 为 什么 第 六 层 是 80 个 而 不 是 79 个 或 81 个 ， 答 案 是 没 
太 多 道理 。) 


第 六 层 的 80 个 神经 元 和 第 七 层 〈 最 后 一 层 ， 即 输出 层 ) 的 10 个 神 
经 元 的 每 一 个 都 相连 接 。 


以 上 卷 积 + 非 线性 + 采样 可 以 看 成 眷 积 网 络 的 一 个 单元 ， 这 个 单元 
的 作用 就 是 “提取 特征 + 压缩 ”， 在 一 个 卷 积 网 络 中 可 以 不 断 地 重复 使 
用 这 个 单元 。 今 天 大 型 的 着 积 网 络 可 能 有 几 百 次 这 样 的 重复 ， 在 这 个 
例子 里 ， 只 重复 了 一 次 。 

卷 积 网 络 为 什么 这 样 设计 ? 为 什么 分 为 卷 积 和 全 连接 两 个 不 同 的 
部 分 ?简单 说 是 省 了 计算 。 如 果 用 全 连接 多 层 网 络 ， 那 么 输入 层 要 有 
32X32=1 024 个 神经 元 ， 在 LeNet 中 最 后 压缩 到 120 个 。 压 缩 的 原理 就 
在 于 对 识别 一 张 图 像 来 说 ， 只 有 图 像 中 的 某 些 特征 是 相关 的 。 例 如 识 
别人 脸 ， 主 要 是 五 官 的 特征 有 用 ， 至 于 背景 是 蓝天 白云 还 是 绿 树 红 花 
都 无 所 谓 。 卷 积 的 模板 就 是 要 提取 出 那些 最 相关 的 特征 。 注 意 ， 这 里 
模板 并 不 需要 事先 设计 好 ， 模 板 中 的 各 像素 的 数值 ， 就 是 神经 网 络 各 
层 的 加 权 系 数 。 根 据 训练 数据 的 不 同 ， 通 过 前 述 的 最 陡 下 降 法 ， 模 板 
各 像素 取 值 最 终 也 不 同 〈( 即 训练 数据 都 是 人 脸 和 训练 数据 都 是 动物 最 
终 演化 出 来 的 模板 不 同 ) 。 每 一 层 使 用 多 少 个 模板 要 在 识别 紊 和 计算 
量 之 间 找 一 个 平衡 ， 模 板 越 多 识别 越 准 确 ， 但 计算 量 也 越 大 。 


附录 2: 循环 神经 网 络 RNN 和 长 - 短 时 记忆 
网 络 LSTM 


循环 神经 网 络 RNN 


CNN 比 较 适 合 处 理 图 像 ， 因 为 每 幅 图 像 之 间 都 没有 太 多 相关 性 ， 所 
以 可 以 一 幅 一 幅 地 输入 CNN 里 。 但 许多 非 图 像 信 息 例 如 语 首 、 天 气 预 
报 、 股 市 等 是 一 个 连续 的 数值 序列 ， 不 仅 无 法 截 成 一 段 一 段 地 输入 ， 
前 后 之 间 还 有 很 强 的 相关 性 。 例 如 我 们 在 下 面 句 子 里 猜 词 填空 : “我 
是 上 海 人 ， 会 讲 一 一 一 一 话 。” 在 这 里 如 果 我 们 没有 看 到 第 一 句 “ 我 
是 上 海 人 ” 束 很 难 填空 。 处 理 这 一 类 问题 最 有 效 的 神经 元 网 络 叫 循环 
神经 网 络 。 图 附 2. 1 是 一 个 最 简单 的 RNN。 


图 附 2.1 最 简单 的 RNN 

这 里 X， 是 t 时 刻 的 输入 向 量 ，A 是 神经 元 网 络 ，h， 是 t 时 刻 的 输 
出 。 注 意 到 方 框 A 有 一 个 自我 反馈 的 箭头 ， 网 络 A 下 一 时 刻 的 状态 依赖 
于 上 一 时 刻 的 状态 ， 这 是 RNN 和 CNN 及 全 连接 网 络 的 最 大 的 区 别 。 为 了 


更 清楚 地 理解 图 附 2.1， 我 们 可 以 把 每 个 离散 时 间 网 络 的 状态 都 画 出 来 
生成 图 附 2. 2。 


图 附 2.2 把 RNN 从 时 间 上 展开 看 


这 个 链 状 结构 展现 出 RNN 与 列表 、 数 据 流 等 序列 化 数据 的 密切 关 
系 ， 而 这 类 数据 的 处 理 也 确实 在 使 用 RNN 这 样 的 神经 网 络 。 在 过 去 几 年 
中 ， 将 RNN 应 用 于 很 多 问题 后 ， 已 经 取得 了 难以 想象 的 成 功 ， 例 如 语音 
识别 、 语 言 建 模 、 翻 译 、 图 像 抓 取 等 ， 而 它 所 涉及 的 领域 还 在 不 断 地 
增加 。 


现在 我 们 已 经 知道 了 RNN 是 什么 ， 以 及 基本 的 工作 原理 。 下 面 我 们 
通过 一 个 有 趣 的 例子 来 加 深 对 RNN 的 理解 : 训练 一 个 基于 字符 的 RNN 语 
言 模型 。 我 们 的 做 法 是 ， 给 RNN“ 喂 ”大 段 的 文字 ， 要 求 它 基于 前 一 段 
字符 建立 下 一 个 字母 的 概率 分 布 ， 这 样 我 们 就 可 以 通过 前 一 个 字母 预 
测 下 一 个 字母 ， 这 样 可 以 一 个 字母 一 个 字母 地 生成 新 的 文字 。 

举 一 个 简单 的 例子 ， 假 设 我 们 的 字母 库 里 只 有 4 个 字母 可 选 : 
“2 多 攻关 总站 学 “a 我 们 想 训 练 出 一 个 能 产生 “hello” 顺序 的 
RNN， 这 个 训练 过 程 事实 上 是 4 个 独立 训练 的 组 合 。 

(1) 给 出 字母 “h” 后 ， 后 面 大 概率 是 字母 “e”。 

(2) 给 出 字符 “he” 后 ， 后 面 大 概率 是 字母 “1”。 

(3) 给 出 字符 “hel” 后 ， 后 面 大 概率 还 是 字母 “1”。 

(4) 给 出 字符 “hel1” 后 ， 后 面 大 概率 是 字母 “o”。 


具体 来 说 ， 我 们 可 以 将 每 个 字母 编码 成 一 个 癌 量 ， 这 个 同 量 除了 
该 字母 顺序 位 是 1， 其 余 位 置 都 是 0〈 例 如 对 于 “h” 而 言 ， 第 一 位 是 
1， 其 余 位 置 都 是 ， 而 “e” 则 第 二 位 是 1， 其 余 位 置 是 0) 。 之 后 我 们 
把 这 些 向 量 一 次 一 个 地 “ 喂 ” 给 RNN， 这 样 可 以 得 到 一 个 四 维 输 出 向 量 
序列 《每 个 维度 对 应 一 个 字母 ) ， 这 个 回 量 序列 我 们 可 以 认为 是 RNN 目 
前 认为 每 个 字母 即将 在 下 一 个 出 现 的 概率 。 


图 附 2. 3 是 一 个 输入 和 输出 层 为 4 维 ， 隐 含 层 为 3 个 单元 〈 神 经 元 ) 
的 RNN。 图 中 显示 了 当 RNN 被 “ 喂 ” 了 字符 “hell” 作 为 输入 后 ， 前 问 
传递 是 如 何 被 激活 的 。 输 出 层 包括 RNN 为 下 一 个 可 能 出 现 的 字母 (字母 
表 里 只 有 h、e、1、o 4 个 字母 ) 所 分 配 的 概率 ， 我 们 希望 输出 层 加 粒 
的 数 越 大 越 好 ， 输 出 层 其 他 的 数 越 小 越 好 。 例 如 ， 我 们 可 以 看 到 在 第 
一 步 时 ，RNN 看 到 字母 “h”， 它 认为 下 一 个 字母 是 “h” 的 概率 是 
1.0， 是 “e” 的 概率 是 2. 2， 是 “1” 的 概率 是 -3. 0， 是 “o” 的 概率 是 
4. 1。 由 于 在 我 们 的 训练 数据 (字符 串 “hello”) 中 ， 正 确 的 下 一 个 
字母 是 “e”， 所 以 我 们 而 望 提 升 “e” 的 概率 ， 同 时 降低 其 他 字母 的 
概率 。 同 样 地 ， 对 于 4 步 中 的 每 一 步 ， 我 们 都 希望 网 络 能 提升 对 茶 一 个 
目标 字母 的 概率 。 由 于 RNN 完 全 由 可 分 的 操作 组 成 ， 因 此 我 们 可 以 采用 
反 回 传播 算法 来 计算 出 我 们 应 该 癌 哪 个 方 问 调整 每 一 个 权 量 ， 以 便 提 
升 正 确 目标 的 概率 《输出 层 里 的 加 粗 数字 ) 。 


输出 字母 : Ye Ey 六 a yy 


输出 层 
隐 含 层 
W_xh 

] 0 0 0 
bt 0 ] 0 0 
输入 层 0 0 | | 

0 0 0 0 
输入 字母 “h” 4 二 放 1 


图 附 2.3 RNN 学 习 “hello” 语句 的 训练 过 程 


接 下 来 我 们 可 以 进行 参数 调整 ， 即 将 每 一 个 权 值 向 着 刚才 说 的 梯 
度 方向 微微 调整 一 点 ， 调 整 之 后 如 果 还 将 刚才 那个 输入 人 字符“ 喂 ” 给 
RNN， 我 们 就 会 看 到 正确 字母 (例如 第 一 步 中 的 “e”) 的 分 值 提 高 
一 反例 如 从 2. 2 提高 到 2.3) ， 而 其 他 字母 的 分 值 降低 了 一 点 。 然 后 
我 们 不 断 地 重复 这 个 步骤 ， 直 到 整个 网 络 的 预测 结果 了 最 终 与 训练 数据 
一 致 ， 即 每 一 步 都 能 正确 预测 下 一 个 字母 。 需 要 注意 的 是 ， 第 一 次 字 
“1” 作 为 输入 时 ， 目 标 输出 是 “1”， 但 第 二 次 目标 输出 就 变 成 了 
“o”， 因 此 RNN 不 是 仅仅 根据 输入 判断 ， 而 是 使 用 反复 出 现 的 关系 来 
了 解 语言 环境 ， 以 便 完 成 任务 。 


LSTM: 记忆 增强 版 RNN 


RNN 可 以 根据 前 一 个 字母 预测 出 下 一 个 字母 。 但 有 时 候 可 能 需要 更 
前 面 的 信息 ， 例 如 我 们 要 填空 “我 在 上 海 出 生 ， 一 直 竺 到 高 中 毕业 ， 
所 以 我 可 以 讲 一 一 一 一 话 ”。 此 时 如 果 没 有 看 到 第 一 句 “ 我 在 上 海 出 
生 ” 束 猜 不 到 填空 的 内 容 。 为 了 解决 这 个 问题 ， 人 们 对 RNN 进 行 了 改 
造 ， 使 其 可 以 有 更 长 的 记忆 。 这 就 是 长 - 短 时 记忆 网 络 (LSTM) 。 


所 有 的 RNN 都 是 链 状 的 、 模 块 不 断 重 复 的 神经 网 络 ， 标 准 的 RNN 
中 ， 重 复 的 模块 结构 简单 。 如 图 附 2. 4 所 示 ， 每 个 模块 由 单个 的 tanh 层 


组 成 。 
人 


图 附 2.4 在 标准 的 RNN 中 ， 重 复 的 模块 是 单 层 结构 


LSTM 也 是 链 状 的 ， 和 RNN 相 比 ， 其 重复 模块 中 的 神经 网 络 并 非 单 
层 ， 而 是 有 4 层 ， 并 且 这 4 层 以 特殊 的 形式 相互 作用 。《 见 图 附 2.5) 


@) 


图 附 2.5 在 LSTM 中 ， 重 复 模 块 中 含有 相互 作用 的 4 层 神经 网 络 


在 图 附 2. 5 中 ，o ( 布 腊 字 和 母 sigma) 是 sigmoid 函 数 ， 其 定义 如 
下 : 


这 个 sigmoid 函 数 的 图 形 如 图 附 2. 6 所 示 。 


-6 -+ 一 2 0 


小 
CN 


图 附 2.6 sigmoid 函 数 的 图 形 
tanh 函 数 是 sigmoid 函 数 的 放大 平移 版 ， 它 们 之 间 的 关系 如 下 : 


tanh (x) =20 (2。X) -1 


一 sigmoid 贞 数 
tanh 贞 数 
] zr | 
0.5 
0 
-0.5 
一 ] 
-4 -2 0 2 4 


图 附 2.7 sigmoid 函 数 和 tanh 函 数 曲 线 
不 要 被 上 面 这 么 多 复杂 的 东西 吓 着 ， 我 们 等 一 下 会 详 述 LSTM 的 结 
构 。 从 现在 开始 ， 请 试图 熟悉 和 适应 我 们 将 使 用 的 一 些 符 号 。 
在 图 附 2. 8 中 左 起 ， 长 方形 表示 已 经 学 习 的 神经 网 络 层 ;圆圈 代表 
逐 点 运算 ， 就 像 同 量 加 法 ; 单 箭 头 代 表 一 个 完整 的 问 量 ， 从 一 个 节点 
的 输出 指 问 另 一 个 节点 的 输入 ; 合并 的 箭头 表示 关联 :分 又 的 盘 头 表 


示 同 样 的 内 容 被 复制 并 发 送 到 不 同 的 地 方 。 


神经 网 络 层 逐 点 运算 问 量 转移 关联 复制 


图 附 2.8 LSTM 中 使 用 的 符号 


LSTM 背 后 的 核心 


Ot A Ein st et 单 
元 状态 有 扩 像 传送 带 ， 它 在 整个 链条 一 直 传 送 下 去 ， 只 有 少数 节操 对 
它 有 影响 ， 信 息 可 以 很 方便 地 传送 过 去 ， 保 竺 不 变 ， 


图 附 2.9 LSTM 的 单元 状态 


LSTM 对 单元 状态 有 增加 或 移 除 信息 的 能 力 ， 但 需要 在 一 个 叫 作 
“ 门 ” 的 结构 下 按照 一 定 的 规范 进行 。“ 门 ”是 有 条 件 地 让 信息 通过 
的 路 径 ， 它 由 一 个 sigmoid 神 经 网 络 层 和 一 个 逐 扣 乘法 运算 构成 。 


图 附 2.10 LSTM 的 单元 “ 门 ”结构 
sigmoid 层 输出 0 1 的 数值 ， 表 示 每 个 要 素 可 以 通过 的 程度 ，0 表 
示 “ 什 么 都 过 不 去 ”，1 表 示 “ 全 部 通过 ”。 一 个 LSTM 有 3 个 这 样 的 
“ 门 ”， 用 来 保护 和 控制 单元 状态 。 


附录 3: CPU、GPU 和 TPU 


GPU 是 神经 网 络 计算 的 引擎 。 图 附 3. 1 是 一 个 典型 的 神经 网 络 ， 用 
输出 误 兰 来 调节 各 层 的 权重 系数 ， 输 入 阵列 X 通 过 参数 窍 阵 运算 进入 下 
一 层 运算 ， 每 一 层 运算 都 是 一 次 这 样 的 矩阵 运算 。 所 请 矩阵 运算 ， 就 
是 先 把 数字 相 乘 再 相 加 。 


误差 
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图 附 3.1 典 型 的 深度 神经 网 络 


为 了 帮助 那些 没有 学 过 矩阵 的 读者 加 深 理 解 ， 现 在 我 们 只 看 图 附 
3. 2 中 左边 输入 和 第 一 层 中 一 个 神经 元 的 关系 : 每 一 个 输入 数字 和 圆圈 
里 的 权重 系数 相 乘 ， 然 后 把 所 有 的 乘积 加 起 来 就 得 到 一 个 值 。 例 如 ， 
输入 有 三 个 单元 ， 分 别 是 (2，5，8) ， 对 应 的 权重 系数 分 别 是 
(2，-1，0.5) ， 它 们 相 乘 后 再 相 加 是 2X2+5X (-1) +8X0. 5=4- 
5+4=3。 这 个 值 再 经 过 一 个 “ 非 线性 ”处 理 : 这 个 值 如 果 大 于 0 就 取 原 


值 ， 小 于 0 就 取 值 为 0。 注 意 这 里 所 有 的 相 乘 运算 都 可 以 同时 进行 ， 这 
就 是 所 谓 的 可 “并 行 运算 ”。 我 们 刚才 描述 的 仅仅 是 一 个 单元 的 计算 
方法 ， 其 他 单元 的 计算 方法 也 都 一 样 ， 也 就 是 说 不 仅 一 个 单元 的 计算 
是 可 以 并 行 的 ， 所 有 单元 的 计算 都 是 可 以 同时 进行 的 。 
输入 本 
起 激活 函数 
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图 附 3.2 神 经 网 络 的 一 个 单元 内 的 计算 


而 GPU 与 CPU 相 比 的 优点 正 是 在 这 里 。 当 年 设计 CPU 时 主要 为 了 执行 
计算 机 程序 ， 绝 大 部 分 计算 机 程序 都 是 “ 串 行 ”的 ， 也 就 是 后 一 个 命 
令 或 计算 要 等 前 一 个 命令 或 计算 的 结果 出 来 后 才能 执行 。 而 GPU 最 初 是 
为 图 形 处 理 用 的 ， 图 形 处 理 的 一 个 特点 就 是 可 以 并 行 。 例 如 ， 从 一 张 
图 中 把 所 有 的 黑 点 找 出 来 ， 就 可 以 把 一 张 图 分 割 成 许多 小 图 同时 来 找 
黑 点 。 图 附 3.3 是 CPU 和 GPU 的 结构 对 比 ， 图 中 左边 的 CPU 通 常 由 一 个 控 
制 器 《Control) 来 给 少数 几 个 功能 强大 的 算术 逻辑 运算 器 (ALU) 分 
配 任 务 ， 而 右边 的 6PU 通 常 由 许多 简单 的 控制 器 ( 右 图 最 左边 一 列 方 
块 ) 来 控制 更 多 的 算术 运算 单元 组 成 (那些 小 格子 ) 。 在 图 形 和 图 像 
处 理 中 大 量 的 运算 都 是 矩阵 运算 ， 所 以 GPU 从 第 一 天 起 就 是 为 矩阵 运算 
设计 的 ， 没 想到 几 十 年 后 的 深度 学 习 也 主要 是 矩阵 运算 ， 这 就 是 “天 


上 的 馅 饼 ”。 


控制 单元 
辑 音 


图 形 处 理 需 


图 附 3.3CPU 结 构 和 GPU 结构 对 比 


图 片 来 源 : https://www. quora. com/Does-CPU-vendors-feel-the-competition- 
from-GPUs-computational-power。 


那么 在 神经 网 络 深 度 学 习 计 算 中 GPU 比 CPU 能 好 多 少 呢 ? 一 个 极端 
的 例子 是 在 深度 学 习 使 用 GPU 之 前 ， 人 谷歌 使 用 16 000 个 CPU 建造 了 一 个 
超级 深度 学 习 网 络 ， 如 图 附 3. 4 所 示 ， 成 本 为 数 百 万 美元 。 


几 年 后 ， 斯 坦 福 大 学 只 用 几 个 GPU 就 可 以 达到 同样 的 性 能 ， 成 本 只 
有 3 万 美元 ! 即使 考 碟 到 必 片 本 号 在 几 年 内 的 发 展 ， 这 个 比较 也 是 怀 人 
的 。 当 然 这 个 比较 仅仅 是 比较 次 度 学 习 的 矩阵 运算 ， 谷 歌 大 脑 还 可 以 
做 很 多 其 他 的 运算 ， 例 如 强化 学 习 等 。 总 的 来 说 ，CPU 适 合 串 行 运算 ， 
可 以 胜任 从 航天 到 手机 的 各 种 不 同 复杂 运算 和 处 理 ， 而 GPU 主要 用 于 简 
单 的 并 行 运 算 ， 并 不 会 取代 CPU。 但 是 在 图 形 处 理 和 深度 神经 网 络 计算 
中 ，GPU 可 以 比 CPU 快 10 倍 甚至 百倍 。 英 伟 达 2017 年 推出 的 用 于 目 动 驾 
驶 的 公 片 Xavier 已 经 达到 每 秒 20 万 亿 次 浮 点 计算 。 


图 附 3.4 谷 歌 用 16 000 个 CPU 搭建 的 深度 学 习 “ 谷 歌 大 脑 " 


图 片 来 源 : 
https://amp. businessinsider. com/images/507ebdd2ecad045603000001- 480- 
360. Jpg。 


2006 一 2017 年 ， 单 片 CPU 的 处 理 能 力 提 高 了 50 倍 。50 倍 的 增长 不 是 
来 自 时 钟 速度 的 提高 〈 即 单 次 运算 变 快 ) ， 而 是 来 自在 心 片 中 赛 进 更 
多 的 处 理 器 。 它 的 内 核 数量 从 4 个 变 到 28 个 ， 是 原来 的 7 倍 。 另 外 一 个 
性 能 的 提升 来 源 于 指令 的 宽度 ，2006 年 一 条 指令 只 能 处 理 2 个 单 精 度 的 
浮 点 运算 ， 今 天 512 位 的 指令 集中 ， 一 条 指令 可 以 同时 处 理 16 个 单 精 度 
的 浮 点 运算 ， 这 束 相 当 于 8 倍 的 性 能 提升 。7X 8=56， 约 50 倍 的 运算 速 
度 提升 就 是 靠 更 多 的 处 理 器 得 来 的 。 


> CPU 处 理 能 力 提高 了 50 售 
> ”从 2006 年 的 0.043 万 亿 次 浮 点 运算 ， 到 2017 年 的 2 万 亿 次 浮 点 运算 〈 单 精度 ) 
> 核心 数量 从 4 变 到 28 
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图 附 3.5 2006 一 2017 年 CPU 运算 速度 的 进展 

图 片 来 源 : 香港 浸 会 大 学 褚 晓 文教 授 “ 深 度 学 习 框架 大 PK” 中 的 五 大 深度 学 习 框架 
三 类 神经 网 络 全 面 测 评 。 

再 看 GPU 在 近 十 年 的 发 展 ， 图 附 3. 6 是 GPU 和 CPU 的 性 能 对 比 。2006 
年 英 伟 达 第 一 次 发 布 通用 计算 的 GPU8800GTX， 当 时 它 的 性 能 已 经 达到 
0. 5 万 亿 次 浮 点 运算 (500 GFlops) ， 接 下 来 的 十 年 ， 大 家 可 以 看 到 
GPU 相对 CPU 的 计算 能 力 一 直 维 持 在 10 ”15 倍 的 比例 。GPU 从 过 去 的 128 个 
核心 变 成 5 376 个 核心 ， 这 个 增长 速度 与 CPU 相同 ， 所 以 GPU 运算 速度 与 
CPU 运算 速度 的 比值 一 直 保 持 不 变 。 


> GPU 实现 30 倍 峰值 性 能 增长 ，17 倍 能 量 效 率 
> 从 2006 年 的 0.5 万 亿 次 浮 点 运算 到 2017 年 15 万 亿 次 ( 单 精度 ) 
> 从 128 个 核心 到 5376 个 核心 
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图 附 3.6 2006 一 2017 年 CPU 和 GPU 计算 能 力 对 比 
图 片 来 源 : 香港 浸 会 大 学 褚 晓 文教 授 “ 深 度 学 习 框架 大 PK” 中 的 五 大 深度 学 习 框 架 
三 类 神经 网 络 全 面 测评 。 

其 他 几 家 互联 网 巨头 也 不 能 眼睁睁 地 看 着 英 伟 达 控 制 着 深度 学 习 
的 命脉 。 谷 歌 就 扒 起 袖子 做 了 一 球 上 自用 的 TPU， 设 计 思 路 是 这 样 的 ， 婚 
然 GPU 通 过 牺牲 通用 性 换取 了 在 图 形 处 理 方 面 比 CPU 快 15 倍 的 性 能 ， 为 
什么 不 能 进一步 专注 于 只 把 神经 网 络 需 要 的 矩阵 运算 做 好 ， 进 一 步 提 
高 速度 呢 ? TPU 设 计 的 核心 诀 罕有 以 下 四 点 。 

第 一 ， 图 形 与 图 像 处 理 需 要 很 高 的 精度 (通常 用 32 比 特 浮 点 精 
度 ) ， 而 用 于 识别 的 神经 网 络 的 参数 并 不 需要 很 高 的 精度 。 所 以 谷歌 
的 第 一 球 TPU 就 专门 为 识别 设计 ， 在 运算 上 放弃 32 比 特 的 浮 点 运算 精 
度 ， 全 部 采用 8 比特 的 整数 精度 。 

第 二 ， 由 于 8 比特 的 乘法 器 比 32 比 特 简单 4X4=16 倍 ， 所 以 在 同等 
蕊 片面 积 上 可 以 多 放 许 多 运算 单元 。 谷 歌 的 第 一 球 TPU 束 有 65 000 个 乘 
加 运算 单元 ， 相 比 最 快 的 GPU 只 有 5 300 个 单元 ， 多 了 不 止 10 倍 。 


第 三 ， 不 论 在 多 核 的 CPU 还 是 GPU 中 ， 目 前 的 运算 速度 瓶颈 都 是 内 
存 的 读 和 写 。 因 为 要 航运 算 的 数据 都 存在 中 央 存 储 融 里 ， 而 这 些 数 字 
在 运算 时 要 分 配 到 几 百 上 千 个 运算 单元 中 ， 从 存储 器 到 运算 单元 可 谓 
“千里 过 过”， 往 返 很 费时 间 。 在 TPU 里 为 了 解决 这 个 问题 ， 干 脆 把 运 
算 单元 摆 成 矩阵 一 样 ， 让 被 运算 的 数据 (例如 神经 网 络 的 输入 数据 ) 
注 漳 过 这 些 运 算 单 元 ， 从 内 存 中 提取 一 个 数据 束 让 它 和 所 有 的 权重 系 
数 都 做 完 乘 法 ， 而 不 是 像 传统 CPU 或 GPU 那样 提取 一 个 数据 只 做 一 次 运 
算 就 放 回 到 存储 器 ， 做 下 一 次 运算 再 千里 人 透 过 从 存储 器 去 取 。 这 样 数 
据 像 波 滔 一 样 一 波 一 波 涌 来 ， 所 以 叫 脉 动 式 计算 。 

第 四 ， 一 个 专注 于 矩阵 运算 的 芯片 不 用 考虑 图 形 处 理 时 要 考虑 的 
许多 其 他 事情 ， 例 如 多 线程 、 分 又 预测 、 跳 序 执行 等 ， 这 是 由 于 脉动 
式 计 算 省 掉 了 许多 暂 存 、 缓 存 等 。 整 个 运算 的 指令 只 有 和 抑 阵 运算 和 取 
非 线性 那么 几 个 ， 例 如 该 数据、 该 参数、 相 乘 、 累 加 、 非 线性 、 写 数 
所 等 。 整 个 心 片 和 软件 部 变 得 非常 简单 ， 这 样 可 以 做 到 每 个 时 钟 周期 
执行 一 次 指令 。 


数据 [ | ] .， [| | 条 出 


二 维 计算 ( CPU ) 


权重 


三 维 计算 ( NovuMind ) 


图 附 3.7 向 量 (一 维 ) 计算 、 和 矩阵 (二 维 ) 计算 和 张 量 (三 维 ) 计算 
图 片 来 源 : https://mp. weixin. qq. com/s/e333KjLavEvvpNIL3u1Y4Q。 


现在 我 们 可 以 算 一 下 TPU 到 底 比 GPU 快 多 少 了 。 谷 歌 第 一 代 的 TPU 有 
256X256=65 536 个 8 比特 乘 加 器 ， 时 钟 是 700MHz， 每 秒 能 做 的 8 比特 乘 
加 运算 =65 536X700X106 =46X1012 次 乘 加 运算 ， 即 92 万 亿 次 整数 
运算 〈92 TOPS， 一 次 乘 加 运算 是 两 次 运算 ) 。 所 以 当 谷 歌 宣 称 比 GPU 
快 时 ， 是 用 整数 运算 次 数 0OPS 和 浮 点 运算 次 数 FLOPS 比 。 而 GPU 是 以 浮 点 
运算 为 测量 单位 的 ， 前 面 说 过 最 新 的 英 伟 达 Xavier 运 算 速度 可 达 20 
TFLOPS， 这 两 个 不 可 直接 相 比 ， 但 如 果 在 神经 网 络 用 于 识别 时 《而 不 
是 用 于 训练 ) ， 浮 点 和 整数 运算 造成 的 识别 准确 率 差 别 不 大 ， 就 可 以 
说 这 款 TPU 比 GPU 快 了 92/20=4. 6 倍 。 对 于 谷歌 这 样 需要 大 量 和 矩阵 运算 的 
公司 可 以 节省 许多 买 GPU 的 钱 ， 并 且 加 快 了 识别 速度 〈 例 如 谷歌 翻译 、 
图 片 识别 等 的 几 亿 用 户 非常 在 意 处 理 速 度 ) ， 更 重要 的 是 把 核心 能 
控制 在 了 自己 手 里 。 谷 歌 在 云 服 务 方面 没有 亚 马 进 做 得 好 ， 正 在 奋起 
直 追 ， 有 了 TPU 则 可 以 给 用 户 提供 更 快 、 更 便宜 的 深度 学 习 云 服务 ， 所 
以 谷歌 的 TPU 目 前 只 给 自己 用 ， 不 卖 给 别人 。 谷 歌 的 第 二 代 TPU 已 经 能 
够 进行 32 比 特 的 单 精度 浮 点 运算 ， 这 样 从 训练 到 识别 都 不 需要 买 别 人 
的 GPU 了 。 用 浮 点 运算 做 识别 还 有 一 个 好 处 就 是 通过 浮 点 运算 训练 出 来 
的 模型 可 以 直接 用 于 识别 ， 而 不 是 像 第 一 代 TPU 那 样 先 要 把 那些 32 比 特 
的 参数 集 都 量化 为 8 比特 。 但 是 通过 刚才 的 讨论 ， 我 们 知道 TPU 更 快 的 
一 个 重要 原因 是 放弃 浮 点 运算 ， 当 TPU 也 需要 浮 点 运算 时 ， 相 比 GPU 的 
性 能 提高 就 不 会 那么 大 了 。 谷 歌 的 第 二 代 (TPU2. 0)〉 可 以 达到 每 秒 45 
万 亿 次 单 精度 浮 点 运算 ， 和 英 伟 达 Xavier 芯 片 比 只 快 了 一 倍 (TPU2.0 
在 Xavier 之 后 出 来 ， 快 一 倍 就 不 算 什 么 ) 。 在 2018 年 谷歌 开发 者 大 会 
上 ， 谷 歌 又 宣布 了 第 三 代 〈TPU3. 0) ， 宣 称 比 TPU2. 0 快 8 倍 。 由 于 功 耗 
的 提高 ， 所 以 第 三 代 芯 片 已 经 需要 液体 制冷 。 一 个 第 三 代 的 TPU 集 群 
(一 个 机 柜 〉， 有 64 块 板 卡 ， 每 块 板 卡 上 有 4 个 TPU， 总 运算 速度 可 以 达 
到 每 秒 8X45X4X64=92 160 万 亿 次 浮 点 计算 。 


附录 4: 机 右 学 习 的 主要 编程 框 染 


yl 


TensorFlow 


TensorFlow 是 由 谷歌 大 脑 团 队 开 发 的 ， 主 要 用 于 机 器 学 习 和 深度 
神经 网 络 的 研究 。2016 年 5 月 ， 谷 歌 从 Torch (一 种 编程 框 染 〉 转移 到 
TensorFlow， 这 对 其 他 编程 框架 造成 了 打击 ， 特 别 是 torch 和 theano。 
许多 人 将 TensorFlow 描 述 成 一 个 比 theano 更 现代 化 的 版 本 ， 吸 取 了 这 
些 年 在 新 领域 / 技术 的 许多 重要 的 经 验 教训 。 


TensorFlow 以 智能 、 灵 活 的 方式 而 闻名 ， 是 一 种 高 度 可 扩展 的 机 
器 学 习 系 统 ， 使 其 更 容易 适应 不 同 的 新 旧 产 品 和 研究 ， 并 且 比 较 容 易 
安装 ， 还 针对 初学 者 提供 了 教程 ， 涵 盖 神 经 网 络 的 理论 基础 和 实际 应 
用 。TensorFlow 比 theano 和 torch 慢 ， 但 谷歌 和 开源 社区 正在 解决 这 个 
问题 。TensorBoard 是 TensorFlow 的 可 视 化 模块 ， 它 提供 了 一 个 计算 路 
径 的 直观 视图 。 深 度 学 习 库 Keras 被 移植 到 TensorFlow 上 运行 ， 这 意味 
着 任何 用 Keras 编 写 的 模型 现在 都 可 以 运行 在 TensorFlow 上 。 最 后 ， 值 
得 一 提 的 是 TensorFlow 可 以 在 各 种 人 硬件 上 运行 。 其 特点 如 下 。 


(1)〉 GPU 加 速 : 支持 。 
(2) 语言 7 界面: Python、 Numpys Ctts 
(0) Tor TBs 
(4) 维护 者 : 谷歌 。 


theano 


theano 起 源 于 2007 年 在 绽 特 利 尔 大 学 的 知名 MILA 学习 算 法 研究 
所 ) ， 是 用 Python 编 写 的 CPU/GPU 符 号 表达 式 的 深度 学 习 编 译 絮 。 
theano 功 能 强大 ， 速 度 极 快 ， 并 且 灵 活 ， 但 通常 被 认为 是 一 个 底层 框 
架 。 因 此 ， 原 生 theano 更 像 是 一 个 研究 平台 和 生态 系统 ， 而 非 深度 学 
习 库 ， 它 经 常 被 用 作 高 级 程序 库 的 底层 平台 ， 而 这 些 高 级 库 给 用 户 提 
供 简 单 的 API。theano 提 供 一 些 比 较 受 欢迎 的 库 包 括 Keras、Lasagne 和 
Blocks。theano 的 缺点 之 一 是 仍然 需要 一 个 支持 多 GPU 的 方案 。theano 
的 特点 如 下 。 


(1) GPU 加 速 : 支持 。 

(2) 语言 / 界面 : Python，Numpy。 
(3) 平台 : Linux、Mac 0S X 和 Windows。 
(4) 维护 者 : 蒙特 利 尔 大 学 MILA 实 验 室 。 


”toror 


在 所 有 常见 的 框架 中 ，torch 可 能 是 最 容易 局 动 和 运行 的 ， 特 别 是 
在 使 用 Ubuntu《〈 一 种 开源 电脑 操作 系统 ) 的 情况 下 。 它 允许 基于 神经 
网 络 的 算法 在 GPU 硬件 上 运行 ， 而 不 需要 在 人 硬件 级 别 进行 编码 。torch 
在 2002 年 由 纽约 大 学 开发 ， 被 Facebook 和 Twitter 等 大 型 科技 公司 广泛 
使 用 ， 并 得 到 英 伟 达 的 支持 。Torch 是 用 一 种 叫 作 Lua 的 脚本 语言 编写 
的 ， 这 种 语言 很 容易 阅读 ， 但 并 不 像 Python 那 样 通 用 。 有 用 的 错误 提 
示 消 息 、 大 量 的 示例 代码 / 教程 以 及 Lua 的 简单 性 让 torch 很 容易 上 
手 。 其 特点 如 下 s 


(1) GPU 加 速 : 支持 。 
(2) 语言 / 界面 : Lua。 


(3) 平台 : Linux、Android、Mac 0S X、i0S 和 Windows。 
(4) 维护 者 : Ronan、Clement、Koray 和 Soumith。 


Caffe 


Caffe 被 开发 用 于 利用 卷 积 神经 网 络 的 图 像 分 类 / 机 器 视觉 ， 由 1 
000 多 名 开发 人 员 推 动 其 发 展 。Caffe 最 出 名 的 可 能 是 Model7Zoo 模 型 ， 
开发 者 无 须 编 写 任 何 代 码 就 可 以 直接 使 用 。 

Caffe 主 要 针对 工业 应 用 ， 而 torch 和 theano 是 为 研究 量 身 打造 
的 。Caffe 不 适用 于 非 计 算 机 视觉 深度 学 习 应 用 ， 如 文本 、 声 音 或 时 间 
序列 数据 。Caffe 可 以 在 各 种 硬件 上 运行 ， 并 且 CPU 和 (GPU 之 间 的 切换 可 
以 通过 设置 单个 标志 来 完成 。Caffe 的 运行 速度 比 theano 和 torch 要 
慢 。 其 特点 如 下 。 

(1) GPU 加 速 : 支持 。 

(2) 语言 / 界面 : C、C++、Python、MATLAB、CLI。 

(3) 平台 Ubuntu、Mac 0S X、Windows 实 验 版 。 

(4) 维护 者 : 伯克利 视觉 和 学 习 中 心 (BVLC) 。 


状 Microsoft 


CNTK 


CNTK 是 微软 深度 学 习 工 具 包 ， 是 微软 的 开源 深度 学 习 框 架 。CNTK 
在 语音 社区 中 比 在 一 般 深度 学 习 社 区 中 更 为 著名 ， 可 以 用 于 图 像 和 文 
本 训练 。CNTK 支 持 多 种 算法 ， 例 如 Feed Forward、CNN、RNN、LSTM 和 
Sequence-to-Sequence。 它 可 以 运行 在 许多 不 同 的 硬件 类 型 上 ， 包 括 
多 个 GCPU。 其 特点 如 下 。 

(1) GPU 加速， 支持 。 


(3) 语言 / 界面 : Python、C++、C# 和 CLI。 


(4) 平台 : Windows、Linux。 
(5) 维护 者 : 微软 研究 院 。 


H,O. ql 


H20 也 称 为 Hz0.ai， 古 世界 上 使 用 最 广泛 的 开源 深度 学 习 平台 之 
一 。 它 锐 全 球 超 过 8 万 名 数据 科学 家 和 研究 人 员 以 及 超过 9000 家 企业 和 
组 织 所 用 ， 包 括 为 全 球 最 有 影响 力 的 一 些 公司 开发 关键 任务 数据 产 
品 。H20 提 供 基 于 Web 的 用 户 界 面 ， 同 时 可 以 访问 机 器 学 习 软 件 库 ， 并 
开局 机 絮 学 习 的 过 程 。 


维基 百科 中 有 一 张 表 详细 列 出 了 各 主要 编程 框架 的 参数 和 特点 ， 
链接 如 下 : 
https://en.wikipedia. org/wiki/Comparison of deep learning 


_software。 
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